aboutsummaryrefslogtreecommitdiffhomepage
path: root/src
diff options
context:
space:
mode:
authorGravatar Mike Klein <mtklein@chromium.org>2017-07-27 12:31:34 -0400
committerGravatar Skia Commit-Bot <skia-commit-bot@chromium.org>2017-07-27 18:33:13 +0000
commitf1b24e0dec93ad2237cf424a797bb88c76b6356b (patch)
tree0a282f9c95558850cf9ce8015eff00b847e776a5 /src
parent7311b40efb0e1a75f3024eac3386e4f7d806675a (diff)
rearrange SkJumper registers on 32-bit x86
There are not many registers on 32-bit x86, and we're using most to pass Stage function arguments. This means few are available as temporaries, and we're forced to hit the stack all the time. xmm registers are the most egregious example: we use all 8 registers pass data, leaving none free as temporaries. This CL cuts things down pretty dramatically, from passing 5 general purpose and 8 xmm registers to 2 general purpose and 4 xmm registers. One of the two general purpose registers is a pointer to space on the stack where we store all those other values. Every stage function needs to use the program pointer, so that stays in a general purpose register. Almost every stage uses the r,g,b,a vectors, so they stay in xmm registers. The rest (destination x,y, the tail mask, a pointer to tricky constants, and the dr,dg,db,da vectors) now live on the stack. The generated code is about 20K smaller and runs about 20% faster. $ out/monobench SkRasterPipeline_srgb 200 Before: 358.784ns After: 282.563ns Change-Id: Icc117af95c1a81c41109984b32e0841022f0d1a6 Reviewed-on: https://skia-review.googlesource.com/27620 Reviewed-by: Florin Malita <fmalita@chromium.org> Commit-Queue: Mike Klein <mtklein@chromium.org>
Diffstat (limited to 'src')
-rw-r--r--src/jumper/SkJumper_generated.S13732
-rw-r--r--src/jumper/SkJumper_generated_win.S13732
-rw-r--r--src/jumper/SkJumper_stages.cpp79
3 files changed, 11356 insertions, 16187 deletions
diff --git a/src/jumper/SkJumper_generated.S b/src/jumper/SkJumper_generated.S
index bc7a0d8255..fb0055af01 100644
--- a/src/jumper/SkJumper_generated.S
+++ b/src/jumper/SkJumper_generated.S
@@ -48619,57 +48619,56 @@ _sk_start_pipeline_sse2:
.byte 83 // push %ebx
.byte 87 // push %edi
.byte 86 // push %esi
- .byte 131,236,12 // sub $0xc,%esp
- .byte 139,117,12 // mov 0xc(%ebp),%esi
- .byte 59,117,20 // cmp 0x14(%ebp),%esi
- .byte 115,107 // jae 7c <_sk_start_pipeline_sse2+0x7c>
- .byte 139,85,28 // mov 0x1c(%ebp),%edx
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,93,24 // mov 0x18(%ebp),%ebx
- .byte 139,59 // mov (%ebx),%edi
- .byte 131,195,4 // add $0x4,%ebx
- .byte 141,64,4 // lea 0x4(%eax),%eax
+ .byte 131,236,92 // sub $0x5c,%esp
+ .byte 139,69,12 // mov 0xc(%ebp),%eax
+ .byte 59,69,20 // cmp 0x14(%ebp),%eax
+ .byte 115,118 // jae 87 <_sk_start_pipeline_sse2+0x87>
+ .byte 139,85,16 // mov 0x10(%ebp),%edx
+ .byte 139,77,8 // mov 0x8(%ebp),%ecx
+ .byte 139,117,24 // mov 0x18(%ebp),%esi
+ .byte 139,62 // mov (%esi),%edi
+ .byte 131,198,4 // add $0x4,%esi
+ .byte 141,73,4 // lea 0x4(%ecx),%ecx
+ .byte 137,77,240 // mov %ecx,-0x10(%ebp)
+ .byte 57,85,240 // cmp %edx,-0x10(%ebp)
+ .byte 139,77,8 // mov 0x8(%ebp),%ecx
+ .byte 137,77,152 // mov %ecx,-0x68(%ebp)
.byte 137,69,236 // mov %eax,-0x14(%ebp)
- .byte 137,117,240 // mov %esi,-0x10(%ebp)
- .byte 57,77,236 // cmp %ecx,-0x14(%ebp)
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 137,222 // mov %ebx,%esi
- .byte 119,37 // ja 5a <_sk_start_pipeline_sse2+0x5a>
- .byte 139,93,8 // mov 0x8(%ebp),%ebx
- .byte 131,236,76 // sub $0x4c,%esp
- .byte 106,0 // push $0x0
- .byte 255,117,240 // pushl -0x10(%ebp)
- .byte 83 // push %ebx
+ .byte 137,69,156 // mov %eax,-0x64(%ebp)
+ .byte 199,69,160,0,0,0,0 // movl $0x0,-0x60(%ebp)
+ .byte 139,69,28 // mov 0x1c(%ebp),%eax
+ .byte 137,69,164 // mov %eax,-0x5c(%ebp)
+ .byte 137,200 // mov %ecx,%eax
+ .byte 141,93,152 // lea -0x68(%ebp),%ebx
+ .byte 119,29 // ja 65 <_sk_start_pipeline_sse2+0x65>
+ .byte 131,236,8 // sub $0x8,%esp
.byte 86 // push %esi
- .byte 82 // push %edx
+ .byte 83 // push %ebx
.byte 255,215 // call *%edi
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
- .byte 139,85,28 // mov 0x1c(%ebp),%edx
- .byte 131,196,96 // add $0x60,%esp
- .byte 141,67,4 // lea 0x4(%ebx),%eax
- .byte 131,195,8 // add $0x8,%ebx
- .byte 57,203 // cmp %ecx,%ebx
- .byte 137,195 // mov %eax,%ebx
- .byte 118,222 // jbe 38 <_sk_start_pipeline_sse2+0x38>
+ .byte 139,85,16 // mov 0x10(%ebp),%edx
+ .byte 131,196,16 // add $0x10,%esp
+ .byte 139,77,152 // mov -0x68(%ebp),%ecx
+ .byte 141,65,4 // lea 0x4(%ecx),%eax
+ .byte 137,69,152 // mov %eax,-0x68(%ebp)
+ .byte 131,193,8 // add $0x8,%ecx
+ .byte 57,209 // cmp %edx,%ecx
+ .byte 118,227 // jbe 48 <_sk_start_pipeline_sse2+0x48>
+ .byte 137,209 // mov %edx,%ecx
.byte 41,193 // sub %eax,%ecx
- .byte 137,243 // mov %esi,%ebx
- .byte 139,117,240 // mov -0x10(%ebp),%esi
- .byte 116,16 // je 73 <_sk_start_pipeline_sse2+0x73>
- .byte 131,236,76 // sub $0x4c,%esp
- .byte 81 // push %ecx
+ .byte 116,19 // je 7e <_sk_start_pipeline_sse2+0x7e>
+ .byte 137,77,160 // mov %ecx,-0x60(%ebp)
+ .byte 131,236,8 // sub $0x8,%esp
.byte 86 // push %esi
+ .byte 141,69,152 // lea -0x68(%ebp),%eax
.byte 80 // push %eax
- .byte 83 // push %ebx
- .byte 82 // push %edx
.byte 255,215 // call *%edi
- .byte 139,85,28 // mov 0x1c(%ebp),%edx
- .byte 131,196,96 // add $0x60,%esp
- .byte 70 // inc %esi
- .byte 59,117,20 // cmp 0x14(%ebp),%esi
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
- .byte 117,172 // jne 28 <_sk_start_pipeline_sse2+0x28>
- .byte 131,196,12 // add $0xc,%esp
+ .byte 139,85,16 // mov 0x10(%ebp),%edx
+ .byte 131,196,16 // add $0x10,%esp
+ .byte 139,69,236 // mov -0x14(%ebp),%eax
+ .byte 64 // inc %eax
+ .byte 59,69,20 // cmp 0x14(%ebp),%eax
+ .byte 117,158 // jne 25 <_sk_start_pipeline_sse2+0x25>
+ .byte 131,196,92 // add $0x5c,%esp
.byte 94 // pop %esi
.byte 95 // pop %edi
.byte 91 // pop %ebx
@@ -48688,47 +48687,38 @@ FUNCTION(_sk_seed_shader_sse2)
_sk_seed_shader_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
.byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 232,0,0,0,0 // call 93 <_sk_seed_shader_sse2+0xe>
- .byte 89 // pop %ecx
- .byte 139,85,20 // mov 0x14(%ebp),%edx
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,125,16 // mov 0x10(%ebp),%edi
- .byte 102,15,110,199 // movd %edi,%xmm0
+ .byte 80 // push %eax
+ .byte 232,0,0,0,0 // call 9a <_sk_seed_shader_sse2+0xa>
+ .byte 88 // pop %eax
+ .byte 139,77,12 // mov 0xc(%ebp),%ecx
+ .byte 139,85,8 // mov 0x8(%ebp),%edx
+ .byte 139,114,12 // mov 0xc(%edx),%esi
+ .byte 102,15,110,2 // movd (%edx),%xmm0
.byte 102,15,112,192,0 // pshufd $0x0,%xmm0,%xmm0
.byte 15,91,200 // cvtdq2ps %xmm0,%xmm1
- .byte 15,40,145,221,144,0,0 // movaps 0x90dd(%ecx),%xmm2
+ .byte 15,40,144,230,109,0,0 // movaps 0x6de6(%eax),%xmm2
.byte 15,88,202 // addps %xmm2,%xmm1
- .byte 15,16,0 // movups (%eax),%xmm0
+ .byte 15,16,6 // movups (%esi),%xmm0
.byte 15,88,193 // addps %xmm1,%xmm0
- .byte 102,15,110,202 // movd %edx,%xmm1
+ .byte 102,15,110,74,4 // movd 0x4(%edx),%xmm1
.byte 102,15,112,201,0 // pshufd $0x0,%xmm1,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
.byte 15,88,202 // addps %xmm2,%xmm1
- .byte 139,93,12 // mov 0xc(%ebp),%ebx
- .byte 141,67,4 // lea 0x4(%ebx),%eax
+ .byte 141,113,4 // lea 0x4(%ecx),%esi
.byte 15,87,210 // xorps %xmm2,%xmm2
- .byte 15,41,84,36,80 // movaps %xmm2,0x50(%esp)
- .byte 15,41,84,36,64 // movaps %xmm2,0x40(%esp)
- .byte 15,41,84,36,48 // movaps %xmm2,0x30(%esp)
- .byte 15,41,84,36,32 // movaps %xmm2,0x20(%esp)
- .byte 139,117,24 // mov 0x18(%ebp),%esi
- .byte 137,116,36,16 // mov %esi,0x10(%esp)
- .byte 137,84,36,12 // mov %edx,0xc(%esp)
- .byte 137,124,36,8 // mov %edi,0x8(%esp)
- .byte 137,68,36,4 // mov %eax,0x4(%esp)
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 137,4,36 // mov %eax,(%esp)
- .byte 15,40,145,237,144,0,0 // movaps 0x90ed(%ecx),%xmm2
+ .byte 15,41,82,64 // movaps %xmm2,0x40(%edx)
+ .byte 15,41,82,48 // movaps %xmm2,0x30(%edx)
+ .byte 15,41,82,32 // movaps %xmm2,0x20(%edx)
+ .byte 15,41,82,16 // movaps %xmm2,0x10(%edx)
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 15,40,144,246,109,0,0 // movaps 0x6df6(%eax),%xmm2
.byte 15,87,219 // xorps %xmm3,%xmm3
- .byte 255,19 // call *(%ebx)
- .byte 131,196,108 // add $0x6c,%esp
+ .byte 86 // push %esi
+ .byte 82 // push %edx
+ .byte 255,17 // call *(%ecx)
+ .byte 131,196,20 // add $0x14,%esp
.byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
.byte 93 // pop %ebp
.byte 195 // ret
@@ -48738,93 +48728,75 @@ FUNCTION(_sk_dither_sse2)
_sk_dither_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
.byte 86 // push %esi
- .byte 129,236,156,0,0,0 // sub $0x9c,%esp
- .byte 15,41,93,184 // movaps %xmm3,-0x48(%ebp)
- .byte 15,41,85,200 // movaps %xmm2,-0x38(%ebp)
- .byte 15,41,77,216 // movaps %xmm1,-0x28(%ebp)
+ .byte 131,236,36 // sub $0x24,%esp
+ .byte 15,41,93,216 // movaps %xmm3,-0x28(%ebp)
+ .byte 15,41,85,232 // movaps %xmm2,-0x18(%ebp)
+ .byte 15,40,217 // movaps %xmm1,%xmm3
.byte 15,40,208 // movaps %xmm0,%xmm2
- .byte 232,0,0,0,0 // call 132 <_sk_dither_sse2+0x20>
- .byte 94 // pop %esi
- .byte 139,77,20 // mov 0x14(%ebp),%ecx
+ .byte 232,0,0,0,0 // call 117 <_sk_dither_sse2+0x1a>
+ .byte 89 // pop %ecx
.byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,85,16 // mov 0x10(%ebp),%edx
- .byte 102,15,110,226 // movd %edx,%xmm4
+ .byte 139,80,12 // mov 0xc(%eax),%edx
+ .byte 102,15,110,32 // movd (%eax),%xmm4
.byte 102,15,112,228,0 // pshufd $0x0,%xmm4,%xmm4
- .byte 243,15,111,104,32 // movdqu 0x20(%eax),%xmm5
+ .byte 243,15,111,106,32 // movdqu 0x20(%edx),%xmm5
.byte 102,15,254,236 // paddd %xmm4,%xmm5
- .byte 102,15,110,225 // movd %ecx,%xmm4
+ .byte 102,15,110,96,4 // movd 0x4(%eax),%xmm4
.byte 102,15,112,252,0 // pshufd $0x0,%xmm4,%xmm7
.byte 102,15,239,253 // pxor %xmm5,%xmm7
- .byte 102,15,111,182,94,144,0,0 // movdqa 0x905e(%esi),%xmm6
+ .byte 102,15,111,177,137,109,0,0 // movdqa 0x6d89(%ecx),%xmm6
.byte 102,15,111,207 // movdqa %xmm7,%xmm1
.byte 102,15,219,206 // pand %xmm6,%xmm1
.byte 102,15,219,245 // pand %xmm5,%xmm6
- .byte 102,15,111,134,126,144,0,0 // movdqa 0x907e(%esi),%xmm0
+ .byte 102,15,111,129,169,109,0,0 // movdqa 0x6da9(%ecx),%xmm0
.byte 102,15,111,231 // movdqa %xmm7,%xmm4
.byte 102,15,219,224 // pand %xmm0,%xmm4
.byte 102,15,219,197 // pand %xmm5,%xmm0
- .byte 102,15,111,158,110,144,0,0 // movdqa 0x906e(%esi),%xmm3
- .byte 102,15,219,251 // pand %xmm3,%xmm7
- .byte 102,15,219,235 // pand %xmm3,%xmm5
+ .byte 102,15,219,185,153,109,0,0 // pand 0x6d99(%ecx),%xmm7
+ .byte 102,15,219,169,153,109,0,0 // pand 0x6d99(%ecx),%xmm5
.byte 102,15,114,246,4 // pslld $0x4,%xmm6
.byte 102,15,254,192 // paddd %xmm0,%xmm0
.byte 102,15,235,198 // por %xmm6,%xmm0
.byte 102,15,114,213,2 // psrld $0x2,%xmm5
.byte 102,15,235,197 // por %xmm5,%xmm0
- .byte 139,125,12 // mov 0xc(%ebp),%edi
.byte 102,15,114,241,5 // pslld $0x5,%xmm1
.byte 102,15,114,244,2 // pslld $0x2,%xmm4
- .byte 102,15,114,215,1 // psrld $0x1,%xmm7
.byte 102,15,235,225 // por %xmm1,%xmm4
.byte 102,15,235,224 // por %xmm0,%xmm4
+ .byte 139,85,12 // mov 0xc(%ebp),%edx
+ .byte 139,50 // mov (%edx),%esi
+ .byte 102,15,114,215,1 // psrld $0x1,%xmm7
.byte 102,15,235,231 // por %xmm7,%xmm4
.byte 15,91,196 // cvtdq2ps %xmm4,%xmm0
- .byte 15,89,134,142,144,0,0 // mulps 0x908e(%esi),%xmm0
- .byte 15,88,134,158,144,0,0 // addps 0x909e(%esi),%xmm0
- .byte 139,55 // mov (%edi),%esi
+ .byte 15,89,129,185,109,0,0 // mulps 0x6db9(%ecx),%xmm0
+ .byte 15,88,129,201,109,0,0 // addps 0x6dc9(%ecx),%xmm0
.byte 243,15,16,14 // movss (%esi),%xmm1
- .byte 139,117,24 // mov 0x18(%ebp),%esi
- .byte 15,40,117,40 // movaps 0x28(%ebp),%xmm6
- .byte 15,40,125,56 // movaps 0x38(%ebp),%xmm7
.byte 15,198,201,0 // shufps $0x0,%xmm1,%xmm1
.byte 15,89,200 // mulps %xmm0,%xmm1
- .byte 15,40,69,72 // movaps 0x48(%ebp),%xmm0
.byte 15,88,209 // addps %xmm1,%xmm2
- .byte 15,40,101,216 // movaps -0x28(%ebp),%xmm4
- .byte 15,88,225 // addps %xmm1,%xmm4
- .byte 15,88,77,200 // addps -0x38(%ebp),%xmm1
- .byte 15,40,93,184 // movaps -0x48(%ebp),%xmm3
- .byte 15,93,211 // minps %xmm3,%xmm2
+ .byte 15,88,217 // addps %xmm1,%xmm3
+ .byte 15,88,77,232 // addps -0x18(%ebp),%xmm1
+ .byte 15,40,69,216 // movaps -0x28(%ebp),%xmm0
+ .byte 15,93,208 // minps %xmm0,%xmm2
.byte 102,15,239,237 // pxor %xmm5,%xmm5
.byte 15,95,234 // maxps %xmm2,%xmm5
- .byte 15,93,227 // minps %xmm3,%xmm4
- .byte 15,40,212 // movaps %xmm4,%xmm2
+ .byte 15,93,216 // minps %xmm0,%xmm3
.byte 15,87,228 // xorps %xmm4,%xmm4
- .byte 15,95,226 // maxps %xmm2,%xmm4
+ .byte 15,95,227 // maxps %xmm3,%xmm4
.byte 15,87,210 // xorps %xmm2,%xmm2
- .byte 15,93,203 // minps %xmm3,%xmm1
+ .byte 15,93,200 // minps %xmm0,%xmm1
+ .byte 15,40,216 // movaps %xmm0,%xmm3
.byte 15,95,209 // maxps %xmm1,%xmm2
- .byte 15,40,77,88 // movaps 0x58(%ebp),%xmm1
- .byte 141,95,8 // lea 0x8(%edi),%ebx
- .byte 15,41,76,36,80 // movaps %xmm1,0x50(%esp)
- .byte 15,41,68,36,64 // movaps %xmm0,0x40(%esp)
- .byte 15,41,124,36,48 // movaps %xmm7,0x30(%esp)
- .byte 15,41,116,36,32 // movaps %xmm6,0x20(%esp)
- .byte 137,116,36,16 // mov %esi,0x10(%esp)
- .byte 137,76,36,12 // mov %ecx,0xc(%esp)
- .byte 137,84,36,8 // mov %edx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
+ .byte 141,74,8 // lea 0x8(%edx),%ecx
+ .byte 131,236,8 // sub $0x8,%esp
.byte 15,40,197 // movaps %xmm5,%xmm0
.byte 15,40,204 // movaps %xmm4,%xmm1
- .byte 255,87,4 // call *0x4(%edi)
- .byte 129,196,156,0,0,0 // add $0x9c,%esp
+ .byte 81 // push %ecx
+ .byte 80 // push %eax
+ .byte 255,82,4 // call *0x4(%edx)
+ .byte 131,196,52 // add $0x34,%esp
.byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
.byte 93 // pop %ebp
.byte 195 // ret
@@ -48834,43 +48806,23 @@ FUNCTION(_sk_uniform_color_sse2)
_sk_uniform_color_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
- .byte 139,85,20 // mov 0x14(%ebp),%edx
- .byte 139,117,12 // mov 0xc(%ebp),%esi
- .byte 139,62 // mov (%esi),%edi
- .byte 243,15,16,7 // movss (%edi),%xmm0
- .byte 243,15,16,79,4 // movss 0x4(%edi),%xmm1
- .byte 243,15,16,87,8 // movss 0x8(%edi),%xmm2
- .byte 243,15,16,95,12 // movss 0xc(%edi),%xmm3
- .byte 139,125,24 // mov 0x18(%ebp),%edi
- .byte 15,40,101,40 // movaps 0x28(%ebp),%xmm4
- .byte 15,40,109,56 // movaps 0x38(%ebp),%xmm5
- .byte 15,40,117,72 // movaps 0x48(%ebp),%xmm6
- .byte 15,40,125,88 // movaps 0x58(%ebp),%xmm7
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 139,69,12 // mov 0xc(%ebp),%eax
+ .byte 139,8 // mov (%eax),%ecx
+ .byte 243,15,16,1 // movss (%ecx),%xmm0
+ .byte 243,15,16,73,4 // movss 0x4(%ecx),%xmm1
.byte 15,198,192,0 // shufps $0x0,%xmm0,%xmm0
.byte 15,198,201,0 // shufps $0x0,%xmm1,%xmm1
+ .byte 243,15,16,81,8 // movss 0x8(%ecx),%xmm2
.byte 15,198,210,0 // shufps $0x0,%xmm2,%xmm2
+ .byte 243,15,16,89,12 // movss 0xc(%ecx),%xmm3
.byte 15,198,219,0 // shufps $0x0,%xmm3,%xmm3
- .byte 141,94,8 // lea 0x8(%esi),%ebx
- .byte 15,41,124,36,80 // movaps %xmm7,0x50(%esp)
- .byte 15,41,116,36,64 // movaps %xmm6,0x40(%esp)
- .byte 15,41,108,36,48 // movaps %xmm5,0x30(%esp)
- .byte 15,41,100,36,32 // movaps %xmm4,0x20(%esp)
- .byte 137,124,36,16 // mov %edi,0x10(%esp)
- .byte 137,84,36,12 // mov %edx,0xc(%esp)
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
- .byte 255,86,4 // call *0x4(%esi)
- .byte 131,196,108 // add $0x6c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 141,72,8 // lea 0x8(%eax),%ecx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 81 // push %ecx
+ .byte 255,117,8 // pushl 0x8(%ebp)
+ .byte 255,80,4 // call *0x4(%eax)
+ .byte 131,196,24 // add $0x18,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -48880,40 +48832,20 @@ FUNCTION(_sk_black_color_sse2)
_sk_black_color_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 232,0,0,0,0 // call 2f7 <_sk_black_color_sse2+0xe>
- .byte 89 // pop %ecx
- .byte 139,85,16 // mov 0x10(%ebp),%edx
- .byte 139,117,20 // mov 0x14(%ebp),%esi
- .byte 139,125,24 // mov 0x18(%ebp),%edi
- .byte 15,40,69,40 // movaps 0x28(%ebp),%xmm0
- .byte 15,40,77,56 // movaps 0x38(%ebp),%xmm1
- .byte 15,40,85,72 // movaps 0x48(%ebp),%xmm2
- .byte 15,40,93,88 // movaps 0x58(%ebp),%xmm3
- .byte 139,93,12 // mov 0xc(%ebp),%ebx
- .byte 141,67,4 // lea 0x4(%ebx),%eax
- .byte 15,41,92,36,80 // movaps %xmm3,0x50(%esp)
- .byte 15,41,84,36,64 // movaps %xmm2,0x40(%esp)
- .byte 15,41,76,36,48 // movaps %xmm1,0x30(%esp)
- .byte 15,41,68,36,32 // movaps %xmm0,0x20(%esp)
- .byte 137,124,36,16 // mov %edi,0x10(%esp)
- .byte 137,116,36,12 // mov %esi,0xc(%esp)
- .byte 137,84,36,8 // mov %edx,0x8(%esp)
- .byte 137,68,36,4 // mov %eax,0x4(%esp)
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 137,4,36 // mov %eax,(%esp)
- .byte 15,40,153,233,142,0,0 // movaps 0x8ee9(%ecx),%xmm3
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 232,0,0,0,0 // call 257 <_sk_black_color_sse2+0xb>
+ .byte 88 // pop %eax
+ .byte 139,77,12 // mov 0xc(%ebp),%ecx
+ .byte 141,81,4 // lea 0x4(%ecx),%edx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 15,40,152,153,108,0,0 // movaps 0x6c99(%eax),%xmm3
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 15,87,201 // xorps %xmm1,%xmm1
.byte 15,87,210 // xorps %xmm2,%xmm2
- .byte 255,19 // call *(%ebx)
- .byte 131,196,108 // add $0x6c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 82 // push %edx
+ .byte 255,117,8 // pushl 0x8(%ebp)
+ .byte 255,17 // call *(%ecx)
+ .byte 131,196,24 // add $0x18,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -48923,40 +48855,20 @@ FUNCTION(_sk_white_color_sse2)
_sk_white_color_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 232,0,0,0,0 // call 369 <_sk_white_color_sse2+0xe>
- .byte 89 // pop %ecx
- .byte 139,85,16 // mov 0x10(%ebp),%edx
- .byte 139,117,20 // mov 0x14(%ebp),%esi
- .byte 139,125,24 // mov 0x18(%ebp),%edi
- .byte 15,40,69,40 // movaps 0x28(%ebp),%xmm0
- .byte 15,40,77,56 // movaps 0x38(%ebp),%xmm1
- .byte 15,40,85,72 // movaps 0x48(%ebp),%xmm2
- .byte 15,40,93,88 // movaps 0x58(%ebp),%xmm3
- .byte 139,93,12 // mov 0xc(%ebp),%ebx
- .byte 141,67,4 // lea 0x4(%ebx),%eax
- .byte 15,41,92,36,80 // movaps %xmm3,0x50(%esp)
- .byte 15,41,84,36,64 // movaps %xmm2,0x40(%esp)
- .byte 15,41,76,36,48 // movaps %xmm1,0x30(%esp)
- .byte 15,41,68,36,32 // movaps %xmm0,0x20(%esp)
- .byte 137,124,36,16 // mov %edi,0x10(%esp)
- .byte 137,116,36,12 // mov %esi,0xc(%esp)
- .byte 137,84,36,8 // mov %edx,0x8(%esp)
- .byte 137,68,36,4 // mov %eax,0x4(%esp)
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 137,4,36 // mov %eax,(%esp)
- .byte 15,40,129,135,142,0,0 // movaps 0x8e87(%ecx),%xmm0
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 232,0,0,0,0 // call 287 <_sk_white_color_sse2+0xb>
+ .byte 88 // pop %eax
+ .byte 139,77,12 // mov 0xc(%ebp),%ecx
+ .byte 141,81,4 // lea 0x4(%ecx),%edx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 15,40,128,121,108,0,0 // movaps 0x6c79(%eax),%xmm0
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 15,40,216 // movaps %xmm0,%xmm3
- .byte 255,19 // call *(%ebx)
- .byte 131,196,108 // add $0x6c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 82 // push %edx
+ .byte 255,117,8 // pushl 0x8(%ebp)
+ .byte 255,17 // call *(%ecx)
+ .byte 131,196,24 // add $0x18,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -48966,39 +48878,19 @@ FUNCTION(_sk_load_rgba_sse2)
_sk_load_rgba_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
- .byte 139,85,20 // mov 0x14(%ebp),%edx
- .byte 139,117,12 // mov 0xc(%ebp),%esi
- .byte 139,62 // mov (%esi),%edi
- .byte 15,16,7 // movups (%edi),%xmm0
- .byte 15,16,79,16 // movups 0x10(%edi),%xmm1
- .byte 15,16,87,32 // movups 0x20(%edi),%xmm2
- .byte 15,16,95,48 // movups 0x30(%edi),%xmm3
- .byte 139,125,24 // mov 0x18(%ebp),%edi
- .byte 15,40,101,40 // movaps 0x28(%ebp),%xmm4
- .byte 15,40,109,56 // movaps 0x38(%ebp),%xmm5
- .byte 15,40,117,72 // movaps 0x48(%ebp),%xmm6
- .byte 15,40,125,88 // movaps 0x58(%ebp),%xmm7
- .byte 141,94,8 // lea 0x8(%esi),%ebx
- .byte 15,41,124,36,80 // movaps %xmm7,0x50(%esp)
- .byte 15,41,116,36,64 // movaps %xmm6,0x40(%esp)
- .byte 15,41,108,36,48 // movaps %xmm5,0x30(%esp)
- .byte 15,41,100,36,32 // movaps %xmm4,0x20(%esp)
- .byte 137,124,36,16 // mov %edi,0x10(%esp)
- .byte 137,84,36,12 // mov %edx,0xc(%esp)
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
- .byte 255,86,4 // call *0x4(%esi)
- .byte 131,196,108 // add $0x6c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 139,69,12 // mov 0xc(%ebp),%eax
+ .byte 139,8 // mov (%eax),%ecx
+ .byte 15,16,1 // movups (%ecx),%xmm0
+ .byte 15,16,73,16 // movups 0x10(%ecx),%xmm1
+ .byte 15,16,81,32 // movups 0x20(%ecx),%xmm2
+ .byte 15,16,89,48 // movups 0x30(%ecx),%xmm3
+ .byte 141,72,8 // lea 0x8(%eax),%ecx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 81 // push %ecx
+ .byte 255,117,8 // pushl 0x8(%ebp)
+ .byte 255,80,4 // call *0x4(%eax)
+ .byte 131,196,24 // add $0x18,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -49008,39 +48900,20 @@ FUNCTION(_sk_store_rgba_sse2)
_sk_store_rgba_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
+ .byte 131,236,8 // sub $0x8,%esp
.byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
- .byte 139,85,20 // mov 0x14(%ebp),%edx
- .byte 139,117,12 // mov 0xc(%ebp),%esi
- .byte 139,62 // mov (%esi),%edi
- .byte 15,17,7 // movups %xmm0,(%edi)
- .byte 15,17,79,16 // movups %xmm1,0x10(%edi)
- .byte 15,17,87,32 // movups %xmm2,0x20(%edi)
- .byte 15,17,95,48 // movups %xmm3,0x30(%edi)
- .byte 139,125,24 // mov 0x18(%ebp),%edi
- .byte 15,40,101,40 // movaps 0x28(%ebp),%xmm4
- .byte 15,40,109,56 // movaps 0x38(%ebp),%xmm5
- .byte 15,40,117,72 // movaps 0x48(%ebp),%xmm6
- .byte 15,40,125,88 // movaps 0x58(%ebp),%xmm7
- .byte 141,94,8 // lea 0x8(%esi),%ebx
- .byte 15,41,124,36,80 // movaps %xmm7,0x50(%esp)
- .byte 15,41,116,36,64 // movaps %xmm6,0x40(%esp)
- .byte 15,41,108,36,48 // movaps %xmm5,0x30(%esp)
- .byte 15,41,100,36,32 // movaps %xmm4,0x20(%esp)
- .byte 137,124,36,16 // mov %edi,0x10(%esp)
- .byte 137,84,36,12 // mov %edx,0xc(%esp)
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
- .byte 255,86,4 // call *0x4(%esi)
- .byte 131,196,108 // add $0x6c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 139,77,12 // mov 0xc(%ebp),%ecx
+ .byte 139,17 // mov (%ecx),%edx
+ .byte 15,17,2 // movups %xmm0,(%edx)
+ .byte 15,17,74,16 // movups %xmm1,0x10(%edx)
+ .byte 15,17,82,32 // movups %xmm2,0x20(%edx)
+ .byte 15,17,90,48 // movups %xmm3,0x30(%edx)
+ .byte 141,81,8 // lea 0x8(%ecx),%edx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 82 // push %edx
+ .byte 80 // push %eax
+ .byte 255,81,4 // call *0x4(%ecx)
+ .byte 131,196,24 // add $0x18,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -49050,38 +48923,18 @@ FUNCTION(_sk_clear_sse2)
_sk_clear_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
- .byte 139,85,20 // mov 0x14(%ebp),%edx
- .byte 139,117,24 // mov 0x18(%ebp),%esi
- .byte 15,40,69,40 // movaps 0x28(%ebp),%xmm0
- .byte 15,40,77,56 // movaps 0x38(%ebp),%xmm1
- .byte 15,40,85,72 // movaps 0x48(%ebp),%xmm2
- .byte 15,40,93,88 // movaps 0x58(%ebp),%xmm3
- .byte 139,125,12 // mov 0xc(%ebp),%edi
- .byte 141,95,4 // lea 0x4(%edi),%ebx
- .byte 15,41,92,36,80 // movaps %xmm3,0x50(%esp)
- .byte 15,41,84,36,64 // movaps %xmm2,0x40(%esp)
- .byte 15,41,76,36,48 // movaps %xmm1,0x30(%esp)
- .byte 15,41,68,36,32 // movaps %xmm0,0x20(%esp)
- .byte 137,116,36,16 // mov %esi,0x10(%esp)
- .byte 137,84,36,12 // mov %edx,0xc(%esp)
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 139,69,12 // mov 0xc(%ebp),%eax
+ .byte 141,72,4 // lea 0x4(%eax),%ecx
+ .byte 131,236,8 // sub $0x8,%esp
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 15,87,201 // xorps %xmm1,%xmm1
.byte 15,87,210 // xorps %xmm2,%xmm2
.byte 15,87,219 // xorps %xmm3,%xmm3
- .byte 255,23 // call *(%edi)
- .byte 131,196,108 // add $0x6c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 81 // push %ecx
+ .byte 255,117,8 // pushl 0x8(%ebp)
+ .byte 255,16 // call *(%eax)
+ .byte 131,196,24 // add $0x18,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -49091,60 +48944,35 @@ FUNCTION(_sk_srcatop_sse2)
_sk_srcatop_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 15,40,234 // movaps %xmm2,%xmm5
- .byte 15,40,225 // movaps %xmm1,%xmm4
- .byte 15,40,208 // movaps %xmm0,%xmm2
- .byte 232,0,0,0,0 // call 528 <_sk_srcatop_sse2+0x17>
- .byte 88 // pop %eax
- .byte 15,40,69,88 // movaps 0x58(%ebp),%xmm0
- .byte 15,89,208 // mulps %xmm0,%xmm2
- .byte 15,40,136,216,140,0,0 // movaps 0x8cd8(%eax),%xmm1
- .byte 15,92,203 // subps %xmm3,%xmm1
- .byte 15,40,249 // movaps %xmm1,%xmm7
- .byte 15,89,125,40 // mulps 0x28(%ebp),%xmm7
- .byte 15,88,215 // addps %xmm7,%xmm2
- .byte 15,89,224 // mulps %xmm0,%xmm4
- .byte 15,40,241 // movaps %xmm1,%xmm6
- .byte 15,89,117,56 // mulps 0x38(%ebp),%xmm6
- .byte 15,88,230 // addps %xmm6,%xmm4
- .byte 15,89,232 // mulps %xmm0,%xmm5
- .byte 15,40,248 // movaps %xmm0,%xmm7
- .byte 15,40,117,72 // movaps 0x48(%ebp),%xmm6
- .byte 15,40,193 // movaps %xmm1,%xmm0
- .byte 15,89,198 // mulps %xmm6,%xmm0
- .byte 15,88,232 // addps %xmm0,%xmm5
- .byte 15,89,223 // mulps %xmm7,%xmm3
- .byte 15,89,207 // mulps %xmm7,%xmm1
- .byte 15,88,217 // addps %xmm1,%xmm3
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
- .byte 139,85,20 // mov 0x14(%ebp),%edx
- .byte 139,117,24 // mov 0x18(%ebp),%esi
- .byte 139,125,12 // mov 0xc(%ebp),%edi
- .byte 141,95,4 // lea 0x4(%edi),%ebx
- .byte 15,41,124,36,80 // movaps %xmm7,0x50(%esp)
- .byte 15,41,116,36,64 // movaps %xmm6,0x40(%esp)
- .byte 15,40,69,56 // movaps 0x38(%ebp),%xmm0
- .byte 15,41,68,36,48 // movaps %xmm0,0x30(%esp)
- .byte 15,40,69,40 // movaps 0x28(%ebp),%xmm0
- .byte 15,41,68,36,32 // movaps %xmm0,0x20(%esp)
- .byte 137,116,36,16 // mov %esi,0x10(%esp)
- .byte 137,84,36,12 // mov %edx,0xc(%esp)
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
- .byte 15,40,194 // movaps %xmm2,%xmm0
- .byte 15,40,204 // movaps %xmm4,%xmm1
- .byte 15,40,213 // movaps %xmm5,%xmm2
- .byte 255,23 // call *(%edi)
- .byte 131,196,108 // add $0x6c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 232,0,0,0,0 // call 336 <_sk_srcatop_sse2+0xb>
+ .byte 90 // pop %edx
+ .byte 139,69,12 // mov 0xc(%ebp),%eax
+ .byte 139,77,8 // mov 0x8(%ebp),%ecx
+ .byte 15,40,97,64 // movaps 0x40(%ecx),%xmm4
+ .byte 15,89,196 // mulps %xmm4,%xmm0
+ .byte 15,40,170,218,107,0,0 // movaps 0x6bda(%edx),%xmm5
+ .byte 15,92,235 // subps %xmm3,%xmm5
+ .byte 15,40,113,16 // movaps 0x10(%ecx),%xmm6
+ .byte 15,89,245 // mulps %xmm5,%xmm6
+ .byte 15,88,198 // addps %xmm6,%xmm0
+ .byte 15,89,204 // mulps %xmm4,%xmm1
+ .byte 15,40,113,32 // movaps 0x20(%ecx),%xmm6
+ .byte 15,89,245 // mulps %xmm5,%xmm6
+ .byte 15,88,206 // addps %xmm6,%xmm1
+ .byte 15,89,212 // mulps %xmm4,%xmm2
+ .byte 15,40,113,48 // movaps 0x30(%ecx),%xmm6
+ .byte 15,89,245 // mulps %xmm5,%xmm6
+ .byte 15,88,214 // addps %xmm6,%xmm2
+ .byte 15,89,220 // mulps %xmm4,%xmm3
+ .byte 15,89,236 // mulps %xmm4,%xmm5
+ .byte 15,88,221 // addps %xmm5,%xmm3
+ .byte 141,80,4 // lea 0x4(%eax),%edx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 82 // push %edx
+ .byte 81 // push %ecx
+ .byte 255,16 // call *(%eax)
+ .byte 131,196,24 // add $0x18,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -49154,54 +48982,36 @@ FUNCTION(_sk_dstatop_sse2)
_sk_dstatop_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 15,40,235 // movaps %xmm3,%xmm5
- .byte 232,0,0,0,0 // call 5d2 <_sk_dstatop_sse2+0x11>
- .byte 88 // pop %eax
- .byte 15,40,245 // movaps %xmm5,%xmm6
- .byte 15,89,117,40 // mulps 0x28(%ebp),%xmm6
- .byte 15,40,184,62,140,0,0 // movaps 0x8c3e(%eax),%xmm7
- .byte 15,92,125,88 // subps 0x58(%ebp),%xmm7
- .byte 15,89,199 // mulps %xmm7,%xmm0
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 232,0,0,0,0 // call 395 <_sk_dstatop_sse2+0xb>
+ .byte 90 // pop %edx
+ .byte 139,69,12 // mov 0xc(%ebp),%eax
+ .byte 139,77,8 // mov 0x8(%ebp),%ecx
+ .byte 15,40,105,64 // movaps 0x40(%ecx),%xmm5
+ .byte 15,40,113,16 // movaps 0x10(%ecx),%xmm6
+ .byte 15,89,243 // mulps %xmm3,%xmm6
+ .byte 15,40,162,139,107,0,0 // movaps 0x6b8b(%edx),%xmm4
+ .byte 15,92,229 // subps %xmm5,%xmm4
+ .byte 15,89,196 // mulps %xmm4,%xmm0
.byte 15,88,198 // addps %xmm6,%xmm0
- .byte 15,40,117,56 // movaps 0x38(%ebp),%xmm6
- .byte 15,89,222 // mulps %xmm6,%xmm3
- .byte 15,89,207 // mulps %xmm7,%xmm1
- .byte 15,88,203 // addps %xmm3,%xmm1
- .byte 15,40,93,72 // movaps 0x48(%ebp),%xmm3
- .byte 15,40,229 // movaps %xmm5,%xmm4
+ .byte 15,40,113,32 // movaps 0x20(%ecx),%xmm6
+ .byte 15,89,243 // mulps %xmm3,%xmm6
+ .byte 15,89,204 // mulps %xmm4,%xmm1
+ .byte 15,88,206 // addps %xmm6,%xmm1
+ .byte 15,40,113,48 // movaps 0x30(%ecx),%xmm6
+ .byte 15,89,243 // mulps %xmm3,%xmm6
+ .byte 15,89,212 // mulps %xmm4,%xmm2
+ .byte 15,88,214 // addps %xmm6,%xmm2
+ .byte 15,89,235 // mulps %xmm3,%xmm5
.byte 15,89,227 // mulps %xmm3,%xmm4
- .byte 15,89,215 // mulps %xmm7,%xmm2
- .byte 15,88,212 // addps %xmm4,%xmm2
- .byte 15,89,253 // mulps %xmm5,%xmm7
- .byte 15,40,101,88 // movaps 0x58(%ebp),%xmm4
- .byte 15,89,236 // mulps %xmm4,%xmm5
- .byte 15,88,239 // addps %xmm7,%xmm5
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
- .byte 139,85,20 // mov 0x14(%ebp),%edx
- .byte 139,117,24 // mov 0x18(%ebp),%esi
- .byte 139,125,12 // mov 0xc(%ebp),%edi
- .byte 141,95,4 // lea 0x4(%edi),%ebx
- .byte 15,41,100,36,80 // movaps %xmm4,0x50(%esp)
- .byte 15,41,92,36,64 // movaps %xmm3,0x40(%esp)
- .byte 15,41,116,36,48 // movaps %xmm6,0x30(%esp)
- .byte 15,40,93,40 // movaps 0x28(%ebp),%xmm3
- .byte 15,41,92,36,32 // movaps %xmm3,0x20(%esp)
- .byte 137,116,36,16 // mov %esi,0x10(%esp)
- .byte 137,84,36,12 // mov %edx,0xc(%esp)
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
- .byte 15,40,221 // movaps %xmm5,%xmm3
- .byte 255,23 // call *(%edi)
- .byte 131,196,108 // add $0x6c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 15,88,229 // addps %xmm5,%xmm4
+ .byte 141,80,4 // lea 0x4(%eax),%edx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 15,40,220 // movaps %xmm4,%xmm3
+ .byte 82 // push %edx
+ .byte 81 // push %ecx
+ .byte 255,16 // call *(%eax)
+ .byte 131,196,24 // add $0x18,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -49211,38 +49021,20 @@ FUNCTION(_sk_srcin_sse2)
_sk_srcin_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
- .byte 139,85,20 // mov 0x14(%ebp),%edx
- .byte 139,117,24 // mov 0x18(%ebp),%esi
- .byte 15,40,101,40 // movaps 0x28(%ebp),%xmm4
- .byte 15,40,109,56 // movaps 0x38(%ebp),%xmm5
- .byte 15,40,117,72 // movaps 0x48(%ebp),%xmm6
- .byte 139,125,12 // mov 0xc(%ebp),%edi
- .byte 15,40,125,88 // movaps 0x58(%ebp),%xmm7
- .byte 15,89,199 // mulps %xmm7,%xmm0
- .byte 15,89,207 // mulps %xmm7,%xmm1
- .byte 15,89,215 // mulps %xmm7,%xmm2
- .byte 15,89,223 // mulps %xmm7,%xmm3
- .byte 141,95,4 // lea 0x4(%edi),%ebx
- .byte 15,41,124,36,80 // movaps %xmm7,0x50(%esp)
- .byte 15,41,116,36,64 // movaps %xmm6,0x40(%esp)
- .byte 15,41,108,36,48 // movaps %xmm5,0x30(%esp)
- .byte 15,41,100,36,32 // movaps %xmm4,0x20(%esp)
- .byte 137,116,36,16 // mov %esi,0x10(%esp)
- .byte 137,84,36,12 // mov %edx,0xc(%esp)
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
- .byte 255,23 // call *(%edi)
- .byte 131,196,108 // add $0x6c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 139,69,12 // mov 0xc(%ebp),%eax
+ .byte 139,77,8 // mov 0x8(%ebp),%ecx
+ .byte 15,40,97,64 // movaps 0x40(%ecx),%xmm4
+ .byte 15,89,196 // mulps %xmm4,%xmm0
+ .byte 15,89,204 // mulps %xmm4,%xmm1
+ .byte 15,89,212 // mulps %xmm4,%xmm2
+ .byte 15,89,220 // mulps %xmm4,%xmm3
+ .byte 141,80,4 // lea 0x4(%eax),%edx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 82 // push %edx
+ .byte 81 // push %ecx
+ .byte 255,16 // call *(%eax)
+ .byte 131,196,24 // add $0x18,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -49252,41 +49044,22 @@ FUNCTION(_sk_dstin_sse2)
_sk_dstin_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
- .byte 139,85,20 // mov 0x14(%ebp),%edx
- .byte 139,117,24 // mov 0x18(%ebp),%esi
- .byte 139,125,12 // mov 0xc(%ebp),%edi
- .byte 15,40,101,88 // movaps 0x58(%ebp),%xmm4
- .byte 15,40,109,72 // movaps 0x48(%ebp),%xmm5
- .byte 15,40,117,56 // movaps 0x38(%ebp),%xmm6
- .byte 15,40,125,40 // movaps 0x28(%ebp),%xmm7
- .byte 15,40,195 // movaps %xmm3,%xmm0
- .byte 15,89,199 // mulps %xmm7,%xmm0
- .byte 15,40,203 // movaps %xmm3,%xmm1
- .byte 15,89,206 // mulps %xmm6,%xmm1
- .byte 15,40,211 // movaps %xmm3,%xmm2
- .byte 15,89,213 // mulps %xmm5,%xmm2
- .byte 15,89,220 // mulps %xmm4,%xmm3
- .byte 141,95,4 // lea 0x4(%edi),%ebx
- .byte 15,41,100,36,80 // movaps %xmm4,0x50(%esp)
- .byte 15,41,108,36,64 // movaps %xmm5,0x40(%esp)
- .byte 15,41,116,36,48 // movaps %xmm6,0x30(%esp)
- .byte 15,41,124,36,32 // movaps %xmm7,0x20(%esp)
- .byte 137,116,36,16 // mov %esi,0x10(%esp)
- .byte 137,84,36,12 // mov %edx,0xc(%esp)
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
- .byte 255,23 // call *(%edi)
- .byte 131,196,108 // add $0x6c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 139,69,12 // mov 0xc(%ebp),%eax
+ .byte 139,77,8 // mov 0x8(%ebp),%ecx
+ .byte 15,40,65,16 // movaps 0x10(%ecx),%xmm0
+ .byte 15,89,195 // mulps %xmm3,%xmm0
+ .byte 15,40,73,32 // movaps 0x20(%ecx),%xmm1
+ .byte 15,89,203 // mulps %xmm3,%xmm1
+ .byte 15,40,81,48 // movaps 0x30(%ecx),%xmm2
+ .byte 15,89,211 // mulps %xmm3,%xmm2
+ .byte 15,89,89,64 // mulps 0x40(%ecx),%xmm3
+ .byte 141,80,4 // lea 0x4(%eax),%edx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 82 // push %edx
+ .byte 81 // push %ecx
+ .byte 255,16 // call *(%eax)
+ .byte 131,196,24 // add $0x18,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -49296,42 +49069,23 @@ FUNCTION(_sk_srcout_sse2)
_sk_srcout_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 232,0,0,0,0 // call 746 <_sk_srcout_sse2+0xe>
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 232,0,0,0,0 // call 456 <_sk_srcout_sse2+0xb>
.byte 88 // pop %eax
- .byte 139,77,8 // mov 0x8(%ebp),%ecx
- .byte 139,85,16 // mov 0x10(%ebp),%edx
- .byte 139,117,20 // mov 0x14(%ebp),%esi
- .byte 139,125,24 // mov 0x18(%ebp),%edi
- .byte 15,40,101,40 // movaps 0x28(%ebp),%xmm4
- .byte 15,40,109,56 // movaps 0x38(%ebp),%xmm5
- .byte 15,40,117,88 // movaps 0x58(%ebp),%xmm6
- .byte 15,40,184,218,138,0,0 // movaps 0x8ada(%eax),%xmm7
- .byte 15,92,254 // subps %xmm6,%xmm7
- .byte 15,89,199 // mulps %xmm7,%xmm0
- .byte 15,89,207 // mulps %xmm7,%xmm1
- .byte 15,89,215 // mulps %xmm7,%xmm2
- .byte 15,89,223 // mulps %xmm7,%xmm3
- .byte 15,40,125,72 // movaps 0x48(%ebp),%xmm7
- .byte 139,69,12 // mov 0xc(%ebp),%eax
- .byte 141,88,4 // lea 0x4(%eax),%ebx
- .byte 15,41,116,36,80 // movaps %xmm6,0x50(%esp)
- .byte 15,41,124,36,64 // movaps %xmm7,0x40(%esp)
- .byte 15,41,108,36,48 // movaps %xmm5,0x30(%esp)
- .byte 15,41,100,36,32 // movaps %xmm4,0x20(%esp)
- .byte 137,124,36,16 // mov %edi,0x10(%esp)
- .byte 137,116,36,12 // mov %esi,0xc(%esp)
- .byte 137,84,36,8 // mov %edx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,12,36 // mov %ecx,(%esp)
- .byte 255,16 // call *(%eax)
- .byte 131,196,108 // add $0x6c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 139,77,12 // mov 0xc(%ebp),%ecx
+ .byte 139,85,8 // mov 0x8(%ebp),%edx
+ .byte 15,40,160,218,106,0,0 // movaps 0x6ada(%eax),%xmm4
+ .byte 15,92,98,64 // subps 0x40(%edx),%xmm4
+ .byte 15,89,196 // mulps %xmm4,%xmm0
+ .byte 15,89,204 // mulps %xmm4,%xmm1
+ .byte 15,89,212 // mulps %xmm4,%xmm2
+ .byte 15,89,220 // mulps %xmm4,%xmm3
+ .byte 141,65,4 // lea 0x4(%ecx),%eax
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 80 // push %eax
+ .byte 82 // push %edx
+ .byte 255,17 // call *(%ecx)
+ .byte 131,196,24 // add $0x18,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -49341,47 +49095,27 @@ FUNCTION(_sk_dstout_sse2)
_sk_dstout_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 232,0,0,0,0 // call 7be <_sk_dstout_sse2+0xe>
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 232,0,0,0,0 // call 48e <_sk_dstout_sse2+0xb>
.byte 88 // pop %eax
- .byte 139,77,8 // mov 0x8(%ebp),%ecx
- .byte 139,85,16 // mov 0x10(%ebp),%edx
- .byte 139,117,20 // mov 0x14(%ebp),%esi
- .byte 139,125,24 // mov 0x18(%ebp),%edi
- .byte 15,40,160,114,138,0,0 // movaps 0x8a72(%eax),%xmm4
- .byte 139,69,12 // mov 0xc(%ebp),%eax
- .byte 15,40,109,88 // movaps 0x58(%ebp),%xmm5
- .byte 15,40,117,72 // movaps 0x48(%ebp),%xmm6
- .byte 15,40,125,56 // movaps 0x38(%ebp),%xmm7
- .byte 15,40,77,40 // movaps 0x28(%ebp),%xmm1
+ .byte 139,77,12 // mov 0xc(%ebp),%ecx
+ .byte 139,85,8 // mov 0x8(%ebp),%edx
+ .byte 15,40,160,178,106,0,0 // movaps 0x6ab2(%eax),%xmm4
.byte 15,92,227 // subps %xmm3,%xmm4
- .byte 15,40,196 // movaps %xmm4,%xmm0
- .byte 15,89,193 // mulps %xmm1,%xmm0
- .byte 15,40,217 // movaps %xmm1,%xmm3
- .byte 15,40,204 // movaps %xmm4,%xmm1
- .byte 15,89,207 // mulps %xmm7,%xmm1
- .byte 15,40,212 // movaps %xmm4,%xmm2
- .byte 15,89,214 // mulps %xmm6,%xmm2
- .byte 15,89,229 // mulps %xmm5,%xmm4
- .byte 141,88,4 // lea 0x4(%eax),%ebx
- .byte 15,41,108,36,80 // movaps %xmm5,0x50(%esp)
- .byte 15,41,116,36,64 // movaps %xmm6,0x40(%esp)
- .byte 15,41,124,36,48 // movaps %xmm7,0x30(%esp)
- .byte 15,41,92,36,32 // movaps %xmm3,0x20(%esp)
- .byte 137,124,36,16 // mov %edi,0x10(%esp)
- .byte 137,116,36,12 // mov %esi,0xc(%esp)
- .byte 137,84,36,8 // mov %edx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,12,36 // mov %ecx,(%esp)
+ .byte 15,40,66,16 // movaps 0x10(%edx),%xmm0
+ .byte 15,89,196 // mulps %xmm4,%xmm0
+ .byte 15,40,74,32 // movaps 0x20(%edx),%xmm1
+ .byte 15,89,204 // mulps %xmm4,%xmm1
+ .byte 15,40,82,48 // movaps 0x30(%edx),%xmm2
+ .byte 15,89,212 // mulps %xmm4,%xmm2
+ .byte 15,89,98,64 // mulps 0x40(%edx),%xmm4
+ .byte 141,65,4 // lea 0x4(%ecx),%eax
+ .byte 131,236,8 // sub $0x8,%esp
.byte 15,40,220 // movaps %xmm4,%xmm3
- .byte 255,16 // call *(%eax)
- .byte 131,196,108 // add $0x6c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 80 // push %eax
+ .byte 82 // push %edx
+ .byte 255,17 // call *(%ecx)
+ .byte 131,196,24 // add $0x18,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -49391,55 +49125,30 @@ FUNCTION(_sk_srcover_sse2)
_sk_srcover_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 15,40,226 // movaps %xmm2,%xmm4
- .byte 15,40,209 // movaps %xmm1,%xmm2
- .byte 15,40,200 // movaps %xmm0,%xmm1
- .byte 232,0,0,0,0 // call 84e <_sk_srcover_sse2+0x17>
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 232,0,0,0,0 // call 4d5 <_sk_srcover_sse2+0xb>
.byte 88 // pop %eax
- .byte 15,40,109,40 // movaps 0x28(%ebp),%xmm5
- .byte 15,40,128,242,137,0,0 // movaps 0x89f2(%eax),%xmm0
- .byte 15,92,195 // subps %xmm3,%xmm0
- .byte 15,40,248 // movaps %xmm0,%xmm7
- .byte 15,89,253 // mulps %xmm5,%xmm7
- .byte 15,88,207 // addps %xmm7,%xmm1
- .byte 15,40,248 // movaps %xmm0,%xmm7
- .byte 15,89,125,56 // mulps 0x38(%ebp),%xmm7
- .byte 15,88,215 // addps %xmm7,%xmm2
- .byte 15,40,125,72 // movaps 0x48(%ebp),%xmm7
- .byte 15,40,240 // movaps %xmm0,%xmm6
- .byte 15,89,247 // mulps %xmm7,%xmm6
- .byte 15,88,230 // addps %xmm6,%xmm4
- .byte 15,40,117,88 // movaps 0x58(%ebp),%xmm6
- .byte 15,89,198 // mulps %xmm6,%xmm0
- .byte 15,88,216 // addps %xmm0,%xmm3
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
- .byte 139,85,20 // mov 0x14(%ebp),%edx
- .byte 139,117,24 // mov 0x18(%ebp),%esi
- .byte 139,125,12 // mov 0xc(%ebp),%edi
- .byte 141,95,4 // lea 0x4(%edi),%ebx
- .byte 15,41,116,36,80 // movaps %xmm6,0x50(%esp)
- .byte 15,41,124,36,64 // movaps %xmm7,0x40(%esp)
- .byte 15,40,69,56 // movaps 0x38(%ebp),%xmm0
- .byte 15,41,68,36,48 // movaps %xmm0,0x30(%esp)
- .byte 15,41,108,36,32 // movaps %xmm5,0x20(%esp)
- .byte 137,116,36,16 // mov %esi,0x10(%esp)
- .byte 137,84,36,12 // mov %edx,0xc(%esp)
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
- .byte 15,40,193 // movaps %xmm1,%xmm0
- .byte 15,40,202 // movaps %xmm2,%xmm1
- .byte 15,40,212 // movaps %xmm4,%xmm2
- .byte 255,23 // call *(%edi)
- .byte 131,196,108 // add $0x6c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 139,77,12 // mov 0xc(%ebp),%ecx
+ .byte 139,85,8 // mov 0x8(%ebp),%edx
+ .byte 15,40,160,123,106,0,0 // movaps 0x6a7b(%eax),%xmm4
+ .byte 15,92,227 // subps %xmm3,%xmm4
+ .byte 15,40,106,16 // movaps 0x10(%edx),%xmm5
+ .byte 15,89,236 // mulps %xmm4,%xmm5
+ .byte 15,88,197 // addps %xmm5,%xmm0
+ .byte 15,40,106,32 // movaps 0x20(%edx),%xmm5
+ .byte 15,89,236 // mulps %xmm4,%xmm5
+ .byte 15,88,205 // addps %xmm5,%xmm1
+ .byte 15,40,106,48 // movaps 0x30(%edx),%xmm5
+ .byte 15,89,236 // mulps %xmm4,%xmm5
+ .byte 15,88,213 // addps %xmm5,%xmm2
+ .byte 15,89,98,64 // mulps 0x40(%edx),%xmm4
+ .byte 15,88,220 // addps %xmm4,%xmm3
+ .byte 141,65,4 // lea 0x4(%ecx),%eax
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 80 // push %eax
+ .byte 82 // push %edx
+ .byte 255,17 // call *(%ecx)
+ .byte 131,196,24 // add $0x18,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -49449,46 +49158,29 @@ FUNCTION(_sk_dstover_sse2)
_sk_dstover_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 232,0,0,0,0 // call 8e5 <_sk_dstover_sse2+0xe>
- .byte 90 // pop %edx
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
- .byte 139,117,20 // mov 0x14(%ebp),%esi
- .byte 139,125,24 // mov 0x18(%ebp),%edi
- .byte 15,40,162,107,137,0,0 // movaps 0x896b(%edx),%xmm4
- .byte 139,85,12 // mov 0xc(%ebp),%edx
- .byte 15,40,109,72 // movaps 0x48(%ebp),%xmm5
- .byte 15,40,117,56 // movaps 0x38(%ebp),%xmm6
- .byte 15,40,125,88 // movaps 0x58(%ebp),%xmm7
- .byte 15,92,231 // subps %xmm7,%xmm4
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 232,0,0,0,0 // call 525 <_sk_dstover_sse2+0xb>
+ .byte 88 // pop %eax
+ .byte 139,77,12 // mov 0xc(%ebp),%ecx
+ .byte 139,85,8 // mov 0x8(%ebp),%edx
+ .byte 15,40,106,64 // movaps 0x40(%edx),%xmm5
+ .byte 15,40,160,59,106,0,0 // movaps 0x6a3b(%eax),%xmm4
+ .byte 15,92,229 // subps %xmm5,%xmm4
.byte 15,89,196 // mulps %xmm4,%xmm0
+ .byte 15,88,66,16 // addps 0x10(%edx),%xmm0
.byte 15,89,204 // mulps %xmm4,%xmm1
+ .byte 15,88,74,32 // addps 0x20(%edx),%xmm1
.byte 15,89,212 // mulps %xmm4,%xmm2
- .byte 15,89,220 // mulps %xmm4,%xmm3
- .byte 15,40,101,40 // movaps 0x28(%ebp),%xmm4
- .byte 15,88,196 // addps %xmm4,%xmm0
- .byte 15,88,206 // addps %xmm6,%xmm1
- .byte 15,88,213 // addps %xmm5,%xmm2
- .byte 15,88,223 // addps %xmm7,%xmm3
- .byte 141,90,4 // lea 0x4(%edx),%ebx
- .byte 15,41,124,36,80 // movaps %xmm7,0x50(%esp)
- .byte 15,41,108,36,64 // movaps %xmm5,0x40(%esp)
- .byte 15,41,116,36,48 // movaps %xmm6,0x30(%esp)
- .byte 15,41,100,36,32 // movaps %xmm4,0x20(%esp)
- .byte 137,124,36,16 // mov %edi,0x10(%esp)
- .byte 137,116,36,12 // mov %esi,0xc(%esp)
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
- .byte 255,18 // call *(%edx)
- .byte 131,196,108 // add $0x6c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 15,88,82,48 // addps 0x30(%edx),%xmm2
+ .byte 15,89,227 // mulps %xmm3,%xmm4
+ .byte 15,88,229 // addps %xmm5,%xmm4
+ .byte 141,65,4 // lea 0x4(%ecx),%eax
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 15,40,220 // movaps %xmm4,%xmm3
+ .byte 80 // push %eax
+ .byte 82 // push %edx
+ .byte 255,17 // call *(%ecx)
+ .byte 131,196,24 // add $0x18,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -49498,38 +49190,19 @@ FUNCTION(_sk_modulate_sse2)
_sk_modulate_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
- .byte 139,85,20 // mov 0x14(%ebp),%edx
- .byte 139,117,24 // mov 0x18(%ebp),%esi
- .byte 139,125,12 // mov 0xc(%ebp),%edi
- .byte 15,40,101,88 // movaps 0x58(%ebp),%xmm4
- .byte 15,40,109,72 // movaps 0x48(%ebp),%xmm5
- .byte 15,40,117,56 // movaps 0x38(%ebp),%xmm6
- .byte 15,40,125,40 // movaps 0x28(%ebp),%xmm7
- .byte 15,89,199 // mulps %xmm7,%xmm0
- .byte 15,89,206 // mulps %xmm6,%xmm1
- .byte 15,89,213 // mulps %xmm5,%xmm2
- .byte 15,89,220 // mulps %xmm4,%xmm3
- .byte 141,95,4 // lea 0x4(%edi),%ebx
- .byte 15,41,100,36,80 // movaps %xmm4,0x50(%esp)
- .byte 15,41,108,36,64 // movaps %xmm5,0x40(%esp)
- .byte 15,41,116,36,48 // movaps %xmm6,0x30(%esp)
- .byte 15,41,124,36,32 // movaps %xmm7,0x20(%esp)
- .byte 137,116,36,16 // mov %esi,0x10(%esp)
- .byte 137,84,36,12 // mov %edx,0xc(%esp)
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
- .byte 255,23 // call *(%edi)
- .byte 131,196,108 // add $0x6c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 139,69,12 // mov 0xc(%ebp),%eax
+ .byte 139,77,8 // mov 0x8(%ebp),%ecx
+ .byte 15,89,65,16 // mulps 0x10(%ecx),%xmm0
+ .byte 15,89,73,32 // mulps 0x20(%ecx),%xmm1
+ .byte 15,89,81,48 // mulps 0x30(%ecx),%xmm2
+ .byte 15,89,89,64 // mulps 0x40(%ecx),%xmm3
+ .byte 141,80,4 // lea 0x4(%eax),%edx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 82 // push %edx
+ .byte 81 // push %ecx
+ .byte 255,16 // call *(%eax)
+ .byte 131,196,24 // add $0x18,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -49539,75 +49212,59 @@ FUNCTION(_sk_multiply_sse2)
_sk_multiply_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 129,236,140,0,0,0 // sub $0x8c,%esp
- .byte 15,41,85,200 // movaps %xmm2,-0x38(%ebp)
+ .byte 131,236,56 // sub $0x38,%esp
+ .byte 15,41,85,216 // movaps %xmm2,-0x28(%ebp)
.byte 15,40,232 // movaps %xmm0,%xmm5
- .byte 232,0,0,0,0 // call 9db <_sk_multiply_sse2+0x18>
- .byte 88 // pop %eax
- .byte 15,40,144,133,136,0,0 // movaps 0x8885(%eax),%xmm2
- .byte 15,40,250 // movaps %xmm2,%xmm7
- .byte 15,92,125,88 // subps 0x58(%ebp),%xmm7
- .byte 15,40,231 // movaps %xmm7,%xmm4
- .byte 15,89,229 // mulps %xmm5,%xmm4
- .byte 15,92,211 // subps %xmm3,%xmm2
- .byte 15,40,69,40 // movaps 0x28(%ebp),%xmm0
- .byte 15,40,242 // movaps %xmm2,%xmm6
- .byte 15,89,240 // mulps %xmm0,%xmm6
- .byte 15,88,244 // addps %xmm4,%xmm6
- .byte 15,89,232 // mulps %xmm0,%xmm5
- .byte 15,88,238 // addps %xmm6,%xmm5
- .byte 15,40,247 // movaps %xmm7,%xmm6
- .byte 15,89,241 // mulps %xmm1,%xmm6
- .byte 15,40,101,56 // movaps 0x38(%ebp),%xmm4
- .byte 15,40,194 // movaps %xmm2,%xmm0
- .byte 15,89,196 // mulps %xmm4,%xmm0
- .byte 15,88,198 // addps %xmm6,%xmm0
+ .byte 232,0,0,0,0 // call 5a4 <_sk_multiply_sse2+0x12>
+ .byte 89 // pop %ecx
+ .byte 139,69,8 // mov 0x8(%ebp),%eax
+ .byte 15,40,80,64 // movaps 0x40(%eax),%xmm2
+ .byte 15,41,85,200 // movaps %xmm2,-0x38(%ebp)
+ .byte 15,40,129,204,105,0,0 // movaps 0x69cc(%ecx),%xmm0
+ .byte 15,40,240 // movaps %xmm0,%xmm6
+ .byte 15,92,242 // subps %xmm2,%xmm6
+ .byte 15,40,254 // movaps %xmm6,%xmm7
+ .byte 15,89,253 // mulps %xmm5,%xmm7
+ .byte 15,92,195 // subps %xmm3,%xmm0
+ .byte 15,40,80,16 // movaps 0x10(%eax),%xmm2
+ .byte 15,40,224 // movaps %xmm0,%xmm4
+ .byte 15,89,226 // mulps %xmm2,%xmm4
+ .byte 15,88,231 // addps %xmm7,%xmm4
+ .byte 15,89,234 // mulps %xmm2,%xmm5
+ .byte 15,88,236 // addps %xmm4,%xmm5
+ .byte 15,40,214 // movaps %xmm6,%xmm2
+ .byte 15,89,209 // mulps %xmm1,%xmm2
+ .byte 15,40,96,32 // movaps 0x20(%eax),%xmm4
+ .byte 15,40,248 // movaps %xmm0,%xmm7
+ .byte 15,89,252 // mulps %xmm4,%xmm7
+ .byte 15,88,250 // addps %xmm2,%xmm7
.byte 15,89,204 // mulps %xmm4,%xmm1
- .byte 15,88,200 // addps %xmm0,%xmm1
- .byte 15,41,77,216 // movaps %xmm1,-0x28(%ebp)
- .byte 15,40,199 // movaps %xmm7,%xmm0
- .byte 15,40,101,200 // movaps -0x38(%ebp),%xmm4
- .byte 15,89,196 // mulps %xmm4,%xmm0
- .byte 15,40,117,72 // movaps 0x48(%ebp),%xmm6
- .byte 15,40,202 // movaps %xmm2,%xmm1
- .byte 15,89,206 // mulps %xmm6,%xmm1
- .byte 15,88,200 // addps %xmm0,%xmm1
- .byte 15,89,230 // mulps %xmm6,%xmm4
- .byte 15,88,225 // addps %xmm1,%xmm4
- .byte 15,89,251 // mulps %xmm3,%xmm7
- .byte 15,40,69,88 // movaps 0x58(%ebp),%xmm0
- .byte 15,89,208 // mulps %xmm0,%xmm2
+ .byte 15,88,207 // addps %xmm7,%xmm1
+ .byte 15,41,77,232 // movaps %xmm1,-0x18(%ebp)
+ .byte 15,40,206 // movaps %xmm6,%xmm1
+ .byte 15,40,85,216 // movaps -0x28(%ebp),%xmm2
+ .byte 15,89,202 // mulps %xmm2,%xmm1
+ .byte 15,40,96,48 // movaps 0x30(%eax),%xmm4
+ .byte 15,40,248 // movaps %xmm0,%xmm7
+ .byte 15,89,252 // mulps %xmm4,%xmm7
+ .byte 15,88,249 // addps %xmm1,%xmm7
+ .byte 15,89,212 // mulps %xmm4,%xmm2
.byte 15,88,215 // addps %xmm7,%xmm2
- .byte 15,89,216 // mulps %xmm0,%xmm3
- .byte 15,88,218 // addps %xmm2,%xmm3
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
- .byte 139,85,20 // mov 0x14(%ebp),%edx
- .byte 139,117,24 // mov 0x18(%ebp),%esi
- .byte 139,125,12 // mov 0xc(%ebp),%edi
- .byte 141,95,4 // lea 0x4(%edi),%ebx
- .byte 15,41,68,36,80 // movaps %xmm0,0x50(%esp)
- .byte 15,41,116,36,64 // movaps %xmm6,0x40(%esp)
- .byte 15,40,69,56 // movaps 0x38(%ebp),%xmm0
- .byte 15,41,68,36,48 // movaps %xmm0,0x30(%esp)
- .byte 15,40,69,40 // movaps 0x28(%ebp),%xmm0
- .byte 15,41,68,36,32 // movaps %xmm0,0x20(%esp)
- .byte 137,116,36,16 // mov %esi,0x10(%esp)
- .byte 137,84,36,12 // mov %edx,0xc(%esp)
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
+ .byte 15,89,243 // mulps %xmm3,%xmm6
+ .byte 15,40,77,200 // movaps -0x38(%ebp),%xmm1
+ .byte 15,89,193 // mulps %xmm1,%xmm0
+ .byte 15,88,198 // addps %xmm6,%xmm0
+ .byte 15,89,217 // mulps %xmm1,%xmm3
+ .byte 15,88,216 // addps %xmm0,%xmm3
+ .byte 139,77,12 // mov 0xc(%ebp),%ecx
+ .byte 141,81,4 // lea 0x4(%ecx),%edx
+ .byte 131,236,8 // sub $0x8,%esp
.byte 15,40,197 // movaps %xmm5,%xmm0
- .byte 15,40,77,216 // movaps -0x28(%ebp),%xmm1
- .byte 15,40,212 // movaps %xmm4,%xmm2
- .byte 255,23 // call *(%edi)
- .byte 129,196,140,0,0,0 // add $0x8c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 15,40,77,232 // movaps -0x18(%ebp),%xmm1
+ .byte 82 // push %edx
+ .byte 80 // push %eax
+ .byte 255,17 // call *(%ecx)
+ .byte 131,196,72 // add $0x48,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -49617,38 +49274,19 @@ FUNCTION(_sk_plus__sse2)
_sk_plus__sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
- .byte 139,85,20 // mov 0x14(%ebp),%edx
- .byte 139,117,24 // mov 0x18(%ebp),%esi
- .byte 139,125,12 // mov 0xc(%ebp),%edi
- .byte 15,40,101,88 // movaps 0x58(%ebp),%xmm4
- .byte 15,40,109,72 // movaps 0x48(%ebp),%xmm5
- .byte 15,40,117,56 // movaps 0x38(%ebp),%xmm6
- .byte 15,40,125,40 // movaps 0x28(%ebp),%xmm7
- .byte 15,88,199 // addps %xmm7,%xmm0
- .byte 15,88,206 // addps %xmm6,%xmm1
- .byte 15,88,213 // addps %xmm5,%xmm2
- .byte 15,88,220 // addps %xmm4,%xmm3
- .byte 141,95,4 // lea 0x4(%edi),%ebx
- .byte 15,41,100,36,80 // movaps %xmm4,0x50(%esp)
- .byte 15,41,108,36,64 // movaps %xmm5,0x40(%esp)
- .byte 15,41,116,36,48 // movaps %xmm6,0x30(%esp)
- .byte 15,41,124,36,32 // movaps %xmm7,0x20(%esp)
- .byte 137,116,36,16 // mov %esi,0x10(%esp)
- .byte 137,84,36,12 // mov %edx,0xc(%esp)
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
- .byte 255,23 // call *(%edi)
- .byte 131,196,108 // add $0x6c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 139,69,12 // mov 0xc(%ebp),%eax
+ .byte 139,77,8 // mov 0x8(%ebp),%ecx
+ .byte 15,88,65,16 // addps 0x10(%ecx),%xmm0
+ .byte 15,88,73,32 // addps 0x20(%ecx),%xmm1
+ .byte 15,88,81,48 // addps 0x30(%ecx),%xmm2
+ .byte 15,88,89,64 // addps 0x40(%ecx),%xmm3
+ .byte 141,80,4 // lea 0x4(%eax),%edx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 82 // push %edx
+ .byte 81 // push %ecx
+ .byte 255,16 // call *(%eax)
+ .byte 131,196,24 // add $0x18,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -49658,55 +49296,39 @@ FUNCTION(_sk_screen_sse2)
_sk_screen_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 15,40,224 // movaps %xmm0,%xmm4
- .byte 15,40,125,72 // movaps 0x48(%ebp),%xmm7
- .byte 15,40,109,56 // movaps 0x38(%ebp),%xmm5
- .byte 15,40,117,40 // movaps 0x28(%ebp),%xmm6
- .byte 15,88,198 // addps %xmm6,%xmm0
- .byte 15,89,230 // mulps %xmm6,%xmm4
- .byte 15,92,196 // subps %xmm4,%xmm0
- .byte 15,40,225 // movaps %xmm1,%xmm4
- .byte 15,88,229 // addps %xmm5,%xmm4
- .byte 15,89,205 // mulps %xmm5,%xmm1
- .byte 15,92,225 // subps %xmm1,%xmm4
- .byte 15,40,234 // movaps %xmm2,%xmm5
- .byte 15,88,239 // addps %xmm7,%xmm5
- .byte 15,89,215 // mulps %xmm7,%xmm2
- .byte 15,92,234 // subps %xmm2,%xmm5
- .byte 15,40,77,88 // movaps 0x58(%ebp),%xmm1
- .byte 15,40,243 // movaps %xmm3,%xmm6
- .byte 15,88,241 // addps %xmm1,%xmm6
- .byte 15,89,217 // mulps %xmm1,%xmm3
- .byte 15,92,243 // subps %xmm3,%xmm6
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
- .byte 139,85,20 // mov 0x14(%ebp),%edx
- .byte 139,117,24 // mov 0x18(%ebp),%esi
- .byte 139,125,12 // mov 0xc(%ebp),%edi
- .byte 141,95,4 // lea 0x4(%edi),%ebx
- .byte 15,41,76,36,80 // movaps %xmm1,0x50(%esp)
- .byte 15,41,124,36,64 // movaps %xmm7,0x40(%esp)
- .byte 15,40,77,56 // movaps 0x38(%ebp),%xmm1
- .byte 15,41,76,36,48 // movaps %xmm1,0x30(%esp)
- .byte 15,40,77,40 // movaps 0x28(%ebp),%xmm1
- .byte 15,41,76,36,32 // movaps %xmm1,0x20(%esp)
- .byte 137,116,36,16 // mov %esi,0x10(%esp)
- .byte 137,84,36,12 // mov %edx,0xc(%esp)
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
- .byte 15,40,204 // movaps %xmm4,%xmm1
- .byte 15,40,213 // movaps %xmm5,%xmm2
- .byte 15,40,222 // movaps %xmm6,%xmm3
- .byte 255,23 // call *(%edi)
- .byte 131,196,108 // add $0x6c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 139,69,12 // mov 0xc(%ebp),%eax
+ .byte 139,77,8 // mov 0x8(%ebp),%ecx
+ .byte 15,40,105,16 // movaps 0x10(%ecx),%xmm5
+ .byte 15,40,113,32 // movaps 0x20(%ecx),%xmm6
+ .byte 15,40,229 // movaps %xmm5,%xmm4
+ .byte 15,88,224 // addps %xmm0,%xmm4
+ .byte 15,89,232 // mulps %xmm0,%xmm5
+ .byte 15,92,229 // subps %xmm5,%xmm4
+ .byte 15,40,238 // movaps %xmm6,%xmm5
+ .byte 15,88,233 // addps %xmm1,%xmm5
+ .byte 15,89,241 // mulps %xmm1,%xmm6
+ .byte 15,92,238 // subps %xmm6,%xmm5
+ .byte 15,40,65,48 // movaps 0x30(%ecx),%xmm0
+ .byte 15,40,240 // movaps %xmm0,%xmm6
+ .byte 15,88,242 // addps %xmm2,%xmm6
+ .byte 15,89,194 // mulps %xmm2,%xmm0
+ .byte 15,92,240 // subps %xmm0,%xmm6
+ .byte 15,40,65,64 // movaps 0x40(%ecx),%xmm0
+ .byte 15,40,248 // movaps %xmm0,%xmm7
+ .byte 15,88,251 // addps %xmm3,%xmm7
+ .byte 15,89,195 // mulps %xmm3,%xmm0
+ .byte 15,92,248 // subps %xmm0,%xmm7
+ .byte 141,80,4 // lea 0x4(%eax),%edx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 15,40,196 // movaps %xmm4,%xmm0
+ .byte 15,40,205 // movaps %xmm5,%xmm1
+ .byte 15,40,214 // movaps %xmm6,%xmm2
+ .byte 15,40,223 // movaps %xmm7,%xmm3
+ .byte 82 // push %edx
+ .byte 81 // push %ecx
+ .byte 255,16 // call *(%eax)
+ .byte 131,196,24 // add $0x18,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -49716,57 +49338,38 @@ FUNCTION(_sk_xor__sse2)
_sk_xor__sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 131,236,124 // sub $0x7c,%esp
- .byte 15,41,93,216 // movaps %xmm3,-0x28(%ebp)
- .byte 232,0,0,0,0 // call bc2 <_sk_xor__sse2+0x12>
- .byte 88 // pop %eax
- .byte 15,40,176,174,134,0,0 // movaps 0x86ae(%eax),%xmm6
- .byte 15,40,254 // movaps %xmm6,%xmm7
- .byte 15,92,125,88 // subps 0x58(%ebp),%xmm7
- .byte 15,89,199 // mulps %xmm7,%xmm0
- .byte 15,92,243 // subps %xmm3,%xmm6
- .byte 15,40,222 // movaps %xmm6,%xmm3
- .byte 15,89,93,40 // mulps 0x28(%ebp),%xmm3
- .byte 15,88,195 // addps %xmm3,%xmm0
- .byte 15,89,207 // mulps %xmm7,%xmm1
- .byte 15,40,93,56 // movaps 0x38(%ebp),%xmm3
- .byte 15,40,230 // movaps %xmm6,%xmm4
- .byte 15,89,227 // mulps %xmm3,%xmm4
- .byte 15,88,204 // addps %xmm4,%xmm1
- .byte 15,89,215 // mulps %xmm7,%xmm2
- .byte 15,40,101,72 // movaps 0x48(%ebp),%xmm4
- .byte 15,40,238 // movaps %xmm6,%xmm5
- .byte 15,89,236 // mulps %xmm4,%xmm5
- .byte 15,88,213 // addps %xmm5,%xmm2
- .byte 15,89,125,216 // mulps -0x28(%ebp),%xmm7
- .byte 15,40,109,88 // movaps 0x58(%ebp),%xmm5
- .byte 15,89,245 // mulps %xmm5,%xmm6
- .byte 15,88,247 // addps %xmm7,%xmm6
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
- .byte 139,85,20 // mov 0x14(%ebp),%edx
- .byte 139,117,24 // mov 0x18(%ebp),%esi
- .byte 139,125,12 // mov 0xc(%ebp),%edi
- .byte 141,95,4 // lea 0x4(%edi),%ebx
- .byte 15,41,108,36,80 // movaps %xmm5,0x50(%esp)
- .byte 15,41,100,36,64 // movaps %xmm4,0x40(%esp)
- .byte 15,41,92,36,48 // movaps %xmm3,0x30(%esp)
- .byte 15,40,93,40 // movaps 0x28(%ebp),%xmm3
- .byte 15,41,92,36,32 // movaps %xmm3,0x20(%esp)
- .byte 137,116,36,16 // mov %esi,0x10(%esp)
- .byte 137,84,36,12 // mov %edx,0xc(%esp)
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
- .byte 15,40,222 // movaps %xmm6,%xmm3
- .byte 255,23 // call *(%edi)
- .byte 131,196,124 // add $0x7c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 15,40,227 // movaps %xmm3,%xmm4
+ .byte 232,0,0,0,0 // call 6df <_sk_xor__sse2+0xe>
+ .byte 90 // pop %edx
+ .byte 139,69,12 // mov 0xc(%ebp),%eax
+ .byte 139,77,8 // mov 0x8(%ebp),%ecx
+ .byte 15,40,105,64 // movaps 0x40(%ecx),%xmm5
+ .byte 15,40,154,161,104,0,0 // movaps 0x68a1(%edx),%xmm3
+ .byte 15,40,243 // movaps %xmm3,%xmm6
+ .byte 15,92,245 // subps %xmm5,%xmm6
+ .byte 15,89,198 // mulps %xmm6,%xmm0
+ .byte 15,92,220 // subps %xmm4,%xmm3
+ .byte 15,40,121,16 // movaps 0x10(%ecx),%xmm7
+ .byte 15,89,251 // mulps %xmm3,%xmm7
+ .byte 15,88,199 // addps %xmm7,%xmm0
+ .byte 15,89,206 // mulps %xmm6,%xmm1
+ .byte 15,40,121,32 // movaps 0x20(%ecx),%xmm7
+ .byte 15,89,251 // mulps %xmm3,%xmm7
+ .byte 15,88,207 // addps %xmm7,%xmm1
+ .byte 15,89,214 // mulps %xmm6,%xmm2
+ .byte 15,40,121,48 // movaps 0x30(%ecx),%xmm7
+ .byte 15,89,251 // mulps %xmm3,%xmm7
+ .byte 15,88,215 // addps %xmm7,%xmm2
+ .byte 15,89,244 // mulps %xmm4,%xmm6
+ .byte 15,89,221 // mulps %xmm5,%xmm3
+ .byte 15,88,222 // addps %xmm6,%xmm3
+ .byte 141,80,4 // lea 0x4(%eax),%edx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 82 // push %edx
+ .byte 81 // push %ecx
+ .byte 255,16 // call *(%eax)
+ .byte 131,196,24 // add $0x18,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -49776,67 +49379,46 @@ FUNCTION(_sk_darken_sse2)
_sk_darken_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 15,40,243 // movaps %xmm3,%xmm6
- .byte 15,40,225 // movaps %xmm1,%xmm4
- .byte 15,40,200 // movaps %xmm0,%xmm1
- .byte 15,40,109,88 // movaps 0x58(%ebp),%xmm5
- .byte 15,40,93,40 // movaps 0x28(%ebp),%xmm3
- .byte 15,89,205 // mulps %xmm5,%xmm1
- .byte 15,40,254 // movaps %xmm6,%xmm7
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 15,40,224 // movaps %xmm0,%xmm4
+ .byte 232,0,0,0,0 // call 747 <_sk_darken_sse2+0xe>
+ .byte 90 // pop %edx
+ .byte 139,69,12 // mov 0xc(%ebp),%eax
+ .byte 139,77,8 // mov 0x8(%ebp),%ecx
+ .byte 15,40,113,64 // movaps 0x40(%ecx),%xmm6
+ .byte 15,40,105,16 // movaps 0x10(%ecx),%xmm5
+ .byte 15,40,121,32 // movaps 0x20(%ecx),%xmm7
+ .byte 15,40,197 // movaps %xmm5,%xmm0
+ .byte 15,88,196 // addps %xmm4,%xmm0
+ .byte 15,89,230 // mulps %xmm6,%xmm4
+ .byte 15,89,235 // mulps %xmm3,%xmm5
+ .byte 15,95,229 // maxps %xmm5,%xmm4
+ .byte 15,92,196 // subps %xmm4,%xmm0
+ .byte 15,40,231 // movaps %xmm7,%xmm4
+ .byte 15,88,225 // addps %xmm1,%xmm4
+ .byte 15,89,206 // mulps %xmm6,%xmm1
.byte 15,89,251 // mulps %xmm3,%xmm7
.byte 15,95,207 // maxps %xmm7,%xmm1
- .byte 15,40,125,56 // movaps 0x38(%ebp),%xmm7
- .byte 15,88,195 // addps %xmm3,%xmm0
- .byte 15,92,193 // subps %xmm1,%xmm0
+ .byte 15,92,225 // subps %xmm1,%xmm4
+ .byte 15,40,73,48 // movaps 0x30(%ecx),%xmm1
+ .byte 15,40,233 // movaps %xmm1,%xmm5
+ .byte 15,88,234 // addps %xmm2,%xmm5
+ .byte 15,89,214 // mulps %xmm6,%xmm2
+ .byte 15,89,203 // mulps %xmm3,%xmm1
+ .byte 15,95,209 // maxps %xmm1,%xmm2
+ .byte 15,92,234 // subps %xmm2,%xmm5
+ .byte 15,40,138,73,104,0,0 // movaps 0x6849(%edx),%xmm1
+ .byte 15,92,203 // subps %xmm3,%xmm1
+ .byte 15,89,206 // mulps %xmm6,%xmm1
+ .byte 15,88,217 // addps %xmm1,%xmm3
+ .byte 141,80,4 // lea 0x4(%eax),%edx
+ .byte 131,236,8 // sub $0x8,%esp
.byte 15,40,204 // movaps %xmm4,%xmm1
- .byte 15,89,229 // mulps %xmm5,%xmm4
- .byte 15,40,222 // movaps %xmm6,%xmm3
- .byte 15,89,223 // mulps %xmm7,%xmm3
- .byte 15,95,227 // maxps %xmm3,%xmm4
- .byte 15,88,207 // addps %xmm7,%xmm1
- .byte 15,92,204 // subps %xmm4,%xmm1
- .byte 15,40,226 // movaps %xmm2,%xmm4
- .byte 15,89,213 // mulps %xmm5,%xmm2
- .byte 15,40,93,72 // movaps 0x48(%ebp),%xmm3
- .byte 15,40,238 // movaps %xmm6,%xmm5
- .byte 15,89,235 // mulps %xmm3,%xmm5
- .byte 15,95,213 // maxps %xmm5,%xmm2
- .byte 15,88,227 // addps %xmm3,%xmm4
- .byte 15,92,226 // subps %xmm2,%xmm4
- .byte 232,0,0,0,0 // call cbc <_sk_darken_sse2+0x63>
- .byte 88 // pop %eax
- .byte 15,40,144,196,133,0,0 // movaps 0x85c4(%eax),%xmm2
- .byte 15,92,214 // subps %xmm6,%xmm2
- .byte 15,40,109,88 // movaps 0x58(%ebp),%xmm5
- .byte 15,89,213 // mulps %xmm5,%xmm2
- .byte 15,88,242 // addps %xmm2,%xmm6
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
- .byte 139,85,20 // mov 0x14(%ebp),%edx
- .byte 139,117,24 // mov 0x18(%ebp),%esi
- .byte 139,125,12 // mov 0xc(%ebp),%edi
- .byte 141,95,4 // lea 0x4(%edi),%ebx
- .byte 15,41,108,36,80 // movaps %xmm5,0x50(%esp)
- .byte 15,41,92,36,64 // movaps %xmm3,0x40(%esp)
- .byte 15,41,124,36,48 // movaps %xmm7,0x30(%esp)
- .byte 15,40,85,40 // movaps 0x28(%ebp),%xmm2
- .byte 15,41,84,36,32 // movaps %xmm2,0x20(%esp)
- .byte 137,116,36,16 // mov %esi,0x10(%esp)
- .byte 137,84,36,12 // mov %edx,0xc(%esp)
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
- .byte 15,40,212 // movaps %xmm4,%xmm2
- .byte 15,40,222 // movaps %xmm6,%xmm3
- .byte 255,23 // call *(%edi)
- .byte 131,196,108 // add $0x6c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 15,40,213 // movaps %xmm5,%xmm2
+ .byte 82 // push %edx
+ .byte 81 // push %ecx
+ .byte 255,16 // call *(%eax)
+ .byte 131,196,24 // add $0x18,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -49846,67 +49428,46 @@ FUNCTION(_sk_lighten_sse2)
_sk_lighten_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 15,40,243 // movaps %xmm3,%xmm6
- .byte 15,40,225 // movaps %xmm1,%xmm4
- .byte 15,40,200 // movaps %xmm0,%xmm1
- .byte 15,40,109,88 // movaps 0x58(%ebp),%xmm5
- .byte 15,40,93,40 // movaps 0x28(%ebp),%xmm3
- .byte 15,89,205 // mulps %xmm5,%xmm1
- .byte 15,40,254 // movaps %xmm6,%xmm7
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 15,40,224 // movaps %xmm0,%xmm4
+ .byte 232,0,0,0,0 // call 7c7 <_sk_lighten_sse2+0xe>
+ .byte 90 // pop %edx
+ .byte 139,69,12 // mov 0xc(%ebp),%eax
+ .byte 139,77,8 // mov 0x8(%ebp),%ecx
+ .byte 15,40,113,64 // movaps 0x40(%ecx),%xmm6
+ .byte 15,40,105,16 // movaps 0x10(%ecx),%xmm5
+ .byte 15,40,121,32 // movaps 0x20(%ecx),%xmm7
+ .byte 15,40,197 // movaps %xmm5,%xmm0
+ .byte 15,88,196 // addps %xmm4,%xmm0
+ .byte 15,89,230 // mulps %xmm6,%xmm4
+ .byte 15,89,235 // mulps %xmm3,%xmm5
+ .byte 15,93,229 // minps %xmm5,%xmm4
+ .byte 15,92,196 // subps %xmm4,%xmm0
+ .byte 15,40,231 // movaps %xmm7,%xmm4
+ .byte 15,88,225 // addps %xmm1,%xmm4
+ .byte 15,89,206 // mulps %xmm6,%xmm1
.byte 15,89,251 // mulps %xmm3,%xmm7
.byte 15,93,207 // minps %xmm7,%xmm1
- .byte 15,40,125,56 // movaps 0x38(%ebp),%xmm7
- .byte 15,88,195 // addps %xmm3,%xmm0
- .byte 15,92,193 // subps %xmm1,%xmm0
+ .byte 15,92,225 // subps %xmm1,%xmm4
+ .byte 15,40,73,48 // movaps 0x30(%ecx),%xmm1
+ .byte 15,40,233 // movaps %xmm1,%xmm5
+ .byte 15,88,234 // addps %xmm2,%xmm5
+ .byte 15,89,214 // mulps %xmm6,%xmm2
+ .byte 15,89,203 // mulps %xmm3,%xmm1
+ .byte 15,93,209 // minps %xmm1,%xmm2
+ .byte 15,92,234 // subps %xmm2,%xmm5
+ .byte 15,40,138,217,103,0,0 // movaps 0x67d9(%edx),%xmm1
+ .byte 15,92,203 // subps %xmm3,%xmm1
+ .byte 15,89,206 // mulps %xmm6,%xmm1
+ .byte 15,88,217 // addps %xmm1,%xmm3
+ .byte 141,80,4 // lea 0x4(%eax),%edx
+ .byte 131,236,8 // sub $0x8,%esp
.byte 15,40,204 // movaps %xmm4,%xmm1
- .byte 15,89,229 // mulps %xmm5,%xmm4
- .byte 15,40,222 // movaps %xmm6,%xmm3
- .byte 15,89,223 // mulps %xmm7,%xmm3
- .byte 15,93,227 // minps %xmm3,%xmm4
- .byte 15,88,207 // addps %xmm7,%xmm1
- .byte 15,92,204 // subps %xmm4,%xmm1
- .byte 15,40,226 // movaps %xmm2,%xmm4
- .byte 15,89,213 // mulps %xmm5,%xmm2
- .byte 15,40,93,72 // movaps 0x48(%ebp),%xmm3
- .byte 15,40,238 // movaps %xmm6,%xmm5
- .byte 15,89,235 // mulps %xmm3,%xmm5
- .byte 15,93,213 // minps %xmm5,%xmm2
- .byte 15,88,227 // addps %xmm3,%xmm4
- .byte 15,92,226 // subps %xmm2,%xmm4
- .byte 232,0,0,0,0 // call d81 <_sk_lighten_sse2+0x63>
- .byte 88 // pop %eax
- .byte 15,40,144,15,133,0,0 // movaps 0x850f(%eax),%xmm2
- .byte 15,92,214 // subps %xmm6,%xmm2
- .byte 15,40,109,88 // movaps 0x58(%ebp),%xmm5
- .byte 15,89,213 // mulps %xmm5,%xmm2
- .byte 15,88,242 // addps %xmm2,%xmm6
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
- .byte 139,85,20 // mov 0x14(%ebp),%edx
- .byte 139,117,24 // mov 0x18(%ebp),%esi
- .byte 139,125,12 // mov 0xc(%ebp),%edi
- .byte 141,95,4 // lea 0x4(%edi),%ebx
- .byte 15,41,108,36,80 // movaps %xmm5,0x50(%esp)
- .byte 15,41,92,36,64 // movaps %xmm3,0x40(%esp)
- .byte 15,41,124,36,48 // movaps %xmm7,0x30(%esp)
- .byte 15,40,85,40 // movaps 0x28(%ebp),%xmm2
- .byte 15,41,84,36,32 // movaps %xmm2,0x20(%esp)
- .byte 137,116,36,16 // mov %esi,0x10(%esp)
- .byte 137,84,36,12 // mov %edx,0xc(%esp)
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
- .byte 15,40,212 // movaps %xmm4,%xmm2
- .byte 15,40,222 // movaps %xmm6,%xmm3
- .byte 255,23 // call *(%edi)
- .byte 131,196,108 // add $0x6c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 15,40,213 // movaps %xmm5,%xmm2
+ .byte 82 // push %edx
+ .byte 81 // push %ecx
+ .byte 255,16 // call *(%eax)
+ .byte 131,196,24 // add $0x18,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -49916,70 +49477,49 @@ FUNCTION(_sk_difference_sse2)
_sk_difference_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 15,40,243 // movaps %xmm3,%xmm6
+ .byte 131,236,8 // sub $0x8,%esp
.byte 15,40,225 // movaps %xmm1,%xmm4
.byte 15,40,200 // movaps %xmm0,%xmm1
- .byte 15,40,109,88 // movaps 0x58(%ebp),%xmm5
- .byte 15,40,93,40 // movaps 0x28(%ebp),%xmm3
+ .byte 232,0,0,0,0 // call 84a <_sk_difference_sse2+0x11>
+ .byte 90 // pop %edx
+ .byte 139,69,12 // mov 0xc(%ebp),%eax
+ .byte 139,77,8 // mov 0x8(%ebp),%ecx
+ .byte 15,40,105,64 // movaps 0x40(%ecx),%xmm5
+ .byte 15,40,113,16 // movaps 0x10(%ecx),%xmm6
+ .byte 15,40,121,32 // movaps 0x20(%ecx),%xmm7
+ .byte 15,40,198 // movaps %xmm6,%xmm0
+ .byte 15,88,193 // addps %xmm1,%xmm0
.byte 15,89,205 // mulps %xmm5,%xmm1
- .byte 15,40,254 // movaps %xmm6,%xmm7
- .byte 15,89,251 // mulps %xmm3,%xmm7
- .byte 15,93,207 // minps %xmm7,%xmm1
- .byte 15,40,125,56 // movaps 0x38(%ebp),%xmm7
- .byte 15,88,195 // addps %xmm3,%xmm0
+ .byte 15,89,243 // mulps %xmm3,%xmm6
+ .byte 15,93,206 // minps %xmm6,%xmm1
.byte 15,88,201 // addps %xmm1,%xmm1
.byte 15,92,193 // subps %xmm1,%xmm0
- .byte 15,40,204 // movaps %xmm4,%xmm1
+ .byte 15,40,207 // movaps %xmm7,%xmm1
+ .byte 15,88,204 // addps %xmm4,%xmm1
.byte 15,89,229 // mulps %xmm5,%xmm4
- .byte 15,40,222 // movaps %xmm6,%xmm3
- .byte 15,89,223 // mulps %xmm7,%xmm3
- .byte 15,93,227 // minps %xmm3,%xmm4
- .byte 15,88,207 // addps %xmm7,%xmm1
+ .byte 15,89,251 // mulps %xmm3,%xmm7
+ .byte 15,93,231 // minps %xmm7,%xmm4
.byte 15,88,228 // addps %xmm4,%xmm4
.byte 15,92,204 // subps %xmm4,%xmm1
- .byte 15,40,226 // movaps %xmm2,%xmm4
+ .byte 15,40,113,48 // movaps 0x30(%ecx),%xmm6
+ .byte 15,40,230 // movaps %xmm6,%xmm4
+ .byte 15,88,226 // addps %xmm2,%xmm4
.byte 15,89,213 // mulps %xmm5,%xmm2
- .byte 15,40,93,72 // movaps 0x48(%ebp),%xmm3
- .byte 15,40,238 // movaps %xmm6,%xmm5
- .byte 15,89,235 // mulps %xmm3,%xmm5
- .byte 15,93,213 // minps %xmm5,%xmm2
- .byte 15,88,227 // addps %xmm3,%xmm4
+ .byte 15,89,243 // mulps %xmm3,%xmm6
+ .byte 15,93,214 // minps %xmm6,%xmm2
.byte 15,88,210 // addps %xmm2,%xmm2
.byte 15,92,226 // subps %xmm2,%xmm4
- .byte 232,0,0,0,0 // call e4f <_sk_difference_sse2+0x6c>
- .byte 88 // pop %eax
- .byte 15,40,144,81,132,0,0 // movaps 0x8451(%eax),%xmm2
- .byte 15,92,214 // subps %xmm6,%xmm2
- .byte 15,40,109,88 // movaps 0x58(%ebp),%xmm5
+ .byte 15,40,146,102,103,0,0 // movaps 0x6766(%edx),%xmm2
+ .byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,213 // mulps %xmm5,%xmm2
- .byte 15,88,242 // addps %xmm2,%xmm6
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
- .byte 139,85,20 // mov 0x14(%ebp),%edx
- .byte 139,117,24 // mov 0x18(%ebp),%esi
- .byte 139,125,12 // mov 0xc(%ebp),%edi
- .byte 141,95,4 // lea 0x4(%edi),%ebx
- .byte 15,41,108,36,80 // movaps %xmm5,0x50(%esp)
- .byte 15,41,92,36,64 // movaps %xmm3,0x40(%esp)
- .byte 15,41,124,36,48 // movaps %xmm7,0x30(%esp)
- .byte 15,40,85,40 // movaps 0x28(%ebp),%xmm2
- .byte 15,41,84,36,32 // movaps %xmm2,0x20(%esp)
- .byte 137,116,36,16 // mov %esi,0x10(%esp)
- .byte 137,84,36,12 // mov %edx,0xc(%esp)
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
+ .byte 15,88,218 // addps %xmm2,%xmm3
+ .byte 141,80,4 // lea 0x4(%eax),%edx
+ .byte 131,236,8 // sub $0x8,%esp
.byte 15,40,212 // movaps %xmm4,%xmm2
- .byte 15,40,222 // movaps %xmm6,%xmm3
- .byte 255,23 // call *(%edi)
- .byte 131,196,108 // add $0x6c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 82 // push %edx
+ .byte 81 // push %ecx
+ .byte 255,16 // call *(%eax)
+ .byte 131,196,24 // add $0x18,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -49989,58 +49529,42 @@ FUNCTION(_sk_exclusion_sse2)
_sk_exclusion_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 15,40,225 // movaps %xmm1,%xmm4
- .byte 15,40,200 // movaps %xmm0,%xmm1
- .byte 232,0,0,0,0 // call ec5 <_sk_exclusion_sse2+0x14>
- .byte 88 // pop %eax
- .byte 15,40,109,72 // movaps 0x48(%ebp),%xmm5
- .byte 15,40,117,56 // movaps 0x38(%ebp),%xmm6
- .byte 15,40,125,40 // movaps 0x28(%ebp),%xmm7
- .byte 15,88,199 // addps %xmm7,%xmm0
- .byte 15,89,207 // mulps %xmm7,%xmm1
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 15,40,224 // movaps %xmm0,%xmm4
+ .byte 232,0,0,0,0 // call 8d0 <_sk_exclusion_sse2+0xe>
+ .byte 90 // pop %edx
+ .byte 139,69,12 // mov 0xc(%ebp),%eax
+ .byte 139,77,8 // mov 0x8(%ebp),%ecx
+ .byte 15,40,105,16 // movaps 0x10(%ecx),%xmm5
+ .byte 15,40,113,32 // movaps 0x20(%ecx),%xmm6
+ .byte 15,40,197 // movaps %xmm5,%xmm0
+ .byte 15,88,196 // addps %xmm4,%xmm0
+ .byte 15,89,236 // mulps %xmm4,%xmm5
+ .byte 15,88,237 // addps %xmm5,%xmm5
+ .byte 15,92,197 // subps %xmm5,%xmm0
+ .byte 15,40,230 // movaps %xmm6,%xmm4
+ .byte 15,88,225 // addps %xmm1,%xmm4
+ .byte 15,89,241 // mulps %xmm1,%xmm6
+ .byte 15,88,246 // addps %xmm6,%xmm6
+ .byte 15,92,230 // subps %xmm6,%xmm4
+ .byte 15,40,73,48 // movaps 0x30(%ecx),%xmm1
+ .byte 15,40,233 // movaps %xmm1,%xmm5
+ .byte 15,88,234 // addps %xmm2,%xmm5
+ .byte 15,89,202 // mulps %xmm2,%xmm1
.byte 15,88,201 // addps %xmm1,%xmm1
- .byte 15,92,193 // subps %xmm1,%xmm0
+ .byte 15,92,233 // subps %xmm1,%xmm5
+ .byte 15,40,138,240,102,0,0 // movaps 0x66f0(%edx),%xmm1
+ .byte 15,92,203 // subps %xmm3,%xmm1
+ .byte 15,89,73,64 // mulps 0x40(%ecx),%xmm1
+ .byte 15,88,217 // addps %xmm1,%xmm3
+ .byte 141,80,4 // lea 0x4(%eax),%edx
+ .byte 131,236,8 // sub $0x8,%esp
.byte 15,40,204 // movaps %xmm4,%xmm1
- .byte 15,88,206 // addps %xmm6,%xmm1
- .byte 15,89,230 // mulps %xmm6,%xmm4
- .byte 15,88,228 // addps %xmm4,%xmm4
- .byte 15,92,204 // subps %xmm4,%xmm1
- .byte 15,40,226 // movaps %xmm2,%xmm4
- .byte 15,88,229 // addps %xmm5,%xmm4
- .byte 15,89,213 // mulps %xmm5,%xmm2
- .byte 15,88,210 // addps %xmm2,%xmm2
- .byte 15,92,226 // subps %xmm2,%xmm4
- .byte 15,40,144,235,131,0,0 // movaps 0x83eb(%eax),%xmm2
- .byte 15,92,211 // subps %xmm3,%xmm2
- .byte 15,40,109,88 // movaps 0x58(%ebp),%xmm5
- .byte 15,89,213 // mulps %xmm5,%xmm2
- .byte 15,88,218 // addps %xmm2,%xmm3
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
- .byte 139,85,20 // mov 0x14(%ebp),%edx
- .byte 139,117,24 // mov 0x18(%ebp),%esi
- .byte 139,125,12 // mov 0xc(%ebp),%edi
- .byte 141,95,4 // lea 0x4(%edi),%ebx
- .byte 15,41,108,36,80 // movaps %xmm5,0x50(%esp)
- .byte 15,40,85,72 // movaps 0x48(%ebp),%xmm2
- .byte 15,41,84,36,64 // movaps %xmm2,0x40(%esp)
- .byte 15,41,116,36,48 // movaps %xmm6,0x30(%esp)
- .byte 15,41,124,36,32 // movaps %xmm7,0x20(%esp)
- .byte 137,116,36,16 // mov %esi,0x10(%esp)
- .byte 137,84,36,12 // mov %edx,0xc(%esp)
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
- .byte 15,40,212 // movaps %xmm4,%xmm2
- .byte 255,23 // call *(%edi)
- .byte 131,196,108 // add $0x6c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 15,40,213 // movaps %xmm5,%xmm2
+ .byte 82 // push %edx
+ .byte 81 // push %ecx
+ .byte 255,16 // call *(%eax)
+ .byte 131,196,24 // add $0x18,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -50050,141 +49574,131 @@ FUNCTION(_sk_colorburn_sse2)
_sk_colorburn_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 129,236,172,0,0,0 // sub $0xac,%esp
- .byte 15,41,85,168 // movaps %xmm2,-0x58(%ebp)
- .byte 15,41,77,200 // movaps %xmm1,-0x38(%ebp)
- .byte 15,40,200 // movaps %xmm0,%xmm1
- .byte 232,0,0,0,0 // call f76 <_sk_colorburn_sse2+0x1c>
- .byte 88 // pop %eax
- .byte 15,40,101,88 // movaps 0x58(%ebp),%xmm4
- .byte 15,40,196 // movaps %xmm4,%xmm0
- .byte 15,92,69,40 // subps 0x28(%ebp),%xmm0
- .byte 15,40,211 // movaps %xmm3,%xmm2
- .byte 15,89,194 // mulps %xmm2,%xmm0
- .byte 15,94,193 // divps %xmm1,%xmm0
- .byte 15,40,244 // movaps %xmm4,%xmm6
- .byte 15,93,240 // minps %xmm0,%xmm6
- .byte 15,40,196 // movaps %xmm4,%xmm0
+ .byte 131,236,120 // sub $0x78,%esp
+ .byte 15,40,235 // movaps %xmm3,%xmm5
+ .byte 15,41,109,200 // movaps %xmm5,-0x38(%ebp)
+ .byte 15,41,85,136 // movaps %xmm2,-0x78(%ebp)
+ .byte 15,41,77,168 // movaps %xmm1,-0x58(%ebp)
+ .byte 15,40,216 // movaps %xmm0,%xmm3
+ .byte 232,0,0,0,0 // call 953 <_sk_colorburn_sse2+0x1d>
+ .byte 89 // pop %ecx
+ .byte 139,69,8 // mov 0x8(%ebp),%eax
+ .byte 15,40,64,64 // movaps 0x40(%eax),%xmm0
+ .byte 15,40,96,16 // movaps 0x10(%eax),%xmm4
+ .byte 15,40,208 // movaps %xmm0,%xmm2
+ .byte 15,92,212 // subps %xmm4,%xmm2
+ .byte 15,89,213 // mulps %xmm5,%xmm2
+ .byte 15,94,211 // divps %xmm3,%xmm2
+ .byte 15,40,240 // movaps %xmm0,%xmm6
+ .byte 15,93,242 // minps %xmm2,%xmm6
+ .byte 15,41,69,184 // movaps %xmm0,-0x48(%ebp)
.byte 15,40,232 // movaps %xmm0,%xmm5
.byte 15,92,238 // subps %xmm6,%xmm5
- .byte 15,40,176,74,131,0,0 // movaps 0x834a(%eax),%xmm6
- .byte 15,40,230 // movaps %xmm6,%xmm4
- .byte 15,92,224 // subps %xmm0,%xmm4
- .byte 15,40,220 // movaps %xmm4,%xmm3
- .byte 15,41,101,216 // movaps %xmm4,-0x28(%ebp)
- .byte 15,89,217 // mulps %xmm1,%xmm3
- .byte 15,87,255 // xorps %xmm7,%xmm7
- .byte 15,40,193 // movaps %xmm1,%xmm0
- .byte 15,194,199,0 // cmpeqps %xmm7,%xmm0
- .byte 15,89,234 // mulps %xmm2,%xmm5
- .byte 15,88,235 // addps %xmm3,%xmm5
- .byte 15,84,200 // andps %xmm0,%xmm1
- .byte 15,85,197 // andnps %xmm5,%xmm0
- .byte 15,86,193 // orps %xmm1,%xmm0
- .byte 15,92,242 // subps %xmm2,%xmm6
- .byte 15,40,234 // movaps %xmm2,%xmm5
+ .byte 15,40,177,125,102,0,0 // movaps 0x667d(%ecx),%xmm6
.byte 15,40,206 // movaps %xmm6,%xmm1
- .byte 15,40,85,40 // movaps 0x28(%ebp),%xmm2
- .byte 15,89,202 // mulps %xmm2,%xmm1
- .byte 15,88,193 // addps %xmm1,%xmm0
- .byte 15,40,202 // movaps %xmm2,%xmm1
- .byte 15,194,77,88,0 // cmpeqps 0x58(%ebp),%xmm1
- .byte 15,88,218 // addps %xmm2,%xmm3
- .byte 15,84,217 // andps %xmm1,%xmm3
- .byte 15,85,200 // andnps %xmm0,%xmm1
- .byte 15,86,203 // orps %xmm3,%xmm1
- .byte 15,41,77,184 // movaps %xmm1,-0x48(%ebp)
- .byte 15,40,93,88 // movaps 0x58(%ebp),%xmm3
- .byte 15,40,195 // movaps %xmm3,%xmm0
- .byte 15,92,69,56 // subps 0x38(%ebp),%xmm0
- .byte 15,89,197 // mulps %xmm5,%xmm0
+ .byte 15,92,200 // subps %xmm0,%xmm1
+ .byte 15,41,77,216 // movaps %xmm1,-0x28(%ebp)
+ .byte 15,40,249 // movaps %xmm1,%xmm7
+ .byte 15,89,251 // mulps %xmm3,%xmm7
+ .byte 15,40,196 // movaps %xmm4,%xmm0
+ .byte 15,88,231 // addps %xmm7,%xmm4
.byte 15,40,85,200 // movaps -0x38(%ebp),%xmm2
- .byte 15,94,194 // divps %xmm2,%xmm0
+ .byte 15,89,234 // mulps %xmm2,%xmm5
+ .byte 15,88,239 // addps %xmm7,%xmm5
+ .byte 15,87,255 // xorps %xmm7,%xmm7
.byte 15,40,203 // movaps %xmm3,%xmm1
- .byte 15,93,200 // minps %xmm0,%xmm1
- .byte 15,40,195 // movaps %xmm3,%xmm0
- .byte 15,92,193 // subps %xmm1,%xmm0
- .byte 15,40,220 // movaps %xmm4,%xmm3
- .byte 15,40,202 // movaps %xmm2,%xmm1
- .byte 15,89,217 // mulps %xmm1,%xmm3
- .byte 15,194,215,0 // cmpeqps %xmm7,%xmm2
- .byte 15,89,197 // mulps %xmm5,%xmm0
- .byte 15,40,229 // movaps %xmm5,%xmm4
- .byte 15,88,195 // addps %xmm3,%xmm0
- .byte 15,84,202 // andps %xmm2,%xmm1
- .byte 15,85,208 // andnps %xmm0,%xmm2
- .byte 15,86,209 // orps %xmm1,%xmm2
- .byte 15,40,198 // movaps %xmm6,%xmm0
- .byte 15,40,77,56 // movaps 0x38(%ebp),%xmm1
- .byte 15,89,193 // mulps %xmm1,%xmm0
- .byte 15,88,208 // addps %xmm0,%xmm2
- .byte 15,40,193 // movaps %xmm1,%xmm0
- .byte 15,40,232 // movaps %xmm0,%xmm5
- .byte 15,40,77,88 // movaps 0x58(%ebp),%xmm1
- .byte 15,194,233,0 // cmpeqps %xmm1,%xmm5
- .byte 15,88,216 // addps %xmm0,%xmm3
- .byte 15,84,221 // andps %xmm5,%xmm3
- .byte 15,85,234 // andnps %xmm2,%xmm5
- .byte 15,86,235 // orps %xmm3,%xmm5
- .byte 15,40,193 // movaps %xmm1,%xmm0
- .byte 15,92,69,72 // subps 0x48(%ebp),%xmm0
- .byte 15,89,196 // mulps %xmm4,%xmm0
- .byte 15,40,93,168 // movaps -0x58(%ebp),%xmm3
- .byte 15,94,195 // divps %xmm3,%xmm0
- .byte 15,40,209 // movaps %xmm1,%xmm2
- .byte 15,93,208 // minps %xmm0,%xmm2
- .byte 15,40,193 // movaps %xmm1,%xmm0
- .byte 15,92,194 // subps %xmm2,%xmm0
+ .byte 15,194,207,0 // cmpeqps %xmm7,%xmm1
+ .byte 15,84,217 // andps %xmm1,%xmm3
+ .byte 15,85,205 // andnps %xmm5,%xmm1
+ .byte 15,86,203 // orps %xmm3,%xmm1
+ .byte 15,92,242 // subps %xmm2,%xmm6
+ .byte 15,41,117,232 // movaps %xmm6,-0x18(%ebp)
+ .byte 15,40,234 // movaps %xmm2,%xmm5
+ .byte 15,40,222 // movaps %xmm6,%xmm3
+ .byte 15,89,216 // mulps %xmm0,%xmm3
+ .byte 15,88,203 // addps %xmm3,%xmm1
+ .byte 15,40,208 // movaps %xmm0,%xmm2
+ .byte 15,40,93,184 // movaps -0x48(%ebp),%xmm3
+ .byte 15,194,211,0 // cmpeqps %xmm3,%xmm2
+ .byte 15,84,226 // andps %xmm2,%xmm4
+ .byte 15,85,209 // andnps %xmm1,%xmm2
+ .byte 15,86,212 // orps %xmm4,%xmm2
+ .byte 15,41,85,152 // movaps %xmm2,-0x68(%ebp)
+ .byte 15,40,64,32 // movaps 0x20(%eax),%xmm0
.byte 15,40,211 // movaps %xmm3,%xmm2
- .byte 15,40,77,216 // movaps -0x28(%ebp),%xmm1
- .byte 15,89,202 // mulps %xmm2,%xmm1
+ .byte 15,92,216 // subps %xmm0,%xmm3
+ .byte 15,89,221 // mulps %xmm5,%xmm3
+ .byte 15,40,77,168 // movaps -0x58(%ebp),%xmm1
+ .byte 15,94,217 // divps %xmm1,%xmm3
+ .byte 15,40,226 // movaps %xmm2,%xmm4
+ .byte 15,93,227 // minps %xmm3,%xmm4
+ .byte 15,40,218 // movaps %xmm2,%xmm3
+ .byte 15,92,220 // subps %xmm4,%xmm3
+ .byte 15,40,101,216 // movaps -0x28(%ebp),%xmm4
+ .byte 15,89,225 // mulps %xmm1,%xmm4
+ .byte 15,40,240 // movaps %xmm0,%xmm6
+ .byte 15,88,244 // addps %xmm4,%xmm6
+ .byte 15,89,221 // mulps %xmm5,%xmm3
+ .byte 15,88,220 // addps %xmm4,%xmm3
+ .byte 15,40,225 // movaps %xmm1,%xmm4
+ .byte 15,87,255 // xorps %xmm7,%xmm7
+ .byte 15,194,231,0 // cmpeqps %xmm7,%xmm4
+ .byte 15,84,204 // andps %xmm4,%xmm1
+ .byte 15,85,227 // andnps %xmm3,%xmm4
+ .byte 15,86,225 // orps %xmm1,%xmm4
+ .byte 15,40,93,232 // movaps -0x18(%ebp),%xmm3
+ .byte 15,89,216 // mulps %xmm0,%xmm3
+ .byte 15,88,227 // addps %xmm3,%xmm4
+ .byte 15,40,248 // movaps %xmm0,%xmm7
.byte 15,194,250,0 // cmpeqps %xmm2,%xmm7
- .byte 15,40,220 // movaps %xmm4,%xmm3
- .byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,193 // addps %xmm1,%xmm0
- .byte 15,84,215 // andps %xmm7,%xmm2
- .byte 15,85,248 // andnps %xmm0,%xmm7
- .byte 15,86,250 // orps %xmm2,%xmm7
- .byte 15,40,198 // movaps %xmm6,%xmm0
- .byte 15,40,85,72 // movaps 0x48(%ebp),%xmm2
+ .byte 15,84,247 // andps %xmm7,%xmm6
+ .byte 15,85,252 // andnps %xmm4,%xmm7
+ .byte 15,86,254 // orps %xmm6,%xmm7
+ .byte 15,40,96,48 // movaps 0x30(%eax),%xmm4
+ .byte 15,40,202 // movaps %xmm2,%xmm1
+ .byte 15,92,204 // subps %xmm4,%xmm1
+ .byte 15,89,205 // mulps %xmm5,%xmm1
+ .byte 15,40,109,136 // movaps -0x78(%ebp),%xmm5
+ .byte 15,94,205 // divps %xmm5,%xmm1
+ .byte 15,40,218 // movaps %xmm2,%xmm3
+ .byte 15,93,217 // minps %xmm1,%xmm3
+ .byte 15,40,69,216 // movaps -0x28(%ebp),%xmm0
+ .byte 15,89,197 // mulps %xmm5,%xmm0
+ .byte 15,41,69,216 // movaps %xmm0,-0x28(%ebp)
+ .byte 15,40,200 // movaps %xmm0,%xmm1
+ .byte 15,88,204 // addps %xmm4,%xmm1
+ .byte 15,40,69,232 // movaps -0x18(%ebp),%xmm0
+ .byte 15,40,240 // movaps %xmm0,%xmm6
+ .byte 15,89,244 // mulps %xmm4,%xmm6
+ .byte 15,194,226,0 // cmpeqps %xmm2,%xmm4
.byte 15,89,194 // mulps %xmm2,%xmm0
- .byte 15,88,248 // addps %xmm0,%xmm7
- .byte 15,40,194 // movaps %xmm2,%xmm0
- .byte 15,194,85,88,0 // cmpeqps 0x58(%ebp),%xmm2
- .byte 15,88,200 // addps %xmm0,%xmm1
- .byte 15,84,202 // andps %xmm2,%xmm1
- .byte 15,85,215 // andnps %xmm7,%xmm2
- .byte 15,86,209 // orps %xmm1,%xmm2
- .byte 15,40,77,88 // movaps 0x58(%ebp),%xmm1
- .byte 15,89,241 // mulps %xmm1,%xmm6
- .byte 15,88,222 // addps %xmm6,%xmm3
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
- .byte 139,85,20 // mov 0x14(%ebp),%edx
- .byte 139,117,24 // mov 0x18(%ebp),%esi
- .byte 139,125,12 // mov 0xc(%ebp),%edi
- .byte 141,95,4 // lea 0x4(%edi),%ebx
- .byte 15,41,76,36,80 // movaps %xmm1,0x50(%esp)
- .byte 15,41,68,36,64 // movaps %xmm0,0x40(%esp)
- .byte 15,40,69,56 // movaps 0x38(%ebp),%xmm0
- .byte 15,41,68,36,48 // movaps %xmm0,0x30(%esp)
- .byte 15,40,69,40 // movaps 0x28(%ebp),%xmm0
- .byte 15,41,68,36,32 // movaps %xmm0,0x20(%esp)
- .byte 137,116,36,16 // mov %esi,0x10(%esp)
- .byte 137,84,36,12 // mov %edx,0xc(%esp)
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
- .byte 15,40,69,184 // movaps -0x48(%ebp),%xmm0
- .byte 15,40,205 // movaps %xmm5,%xmm1
- .byte 255,23 // call *(%edi)
- .byte 129,196,172,0,0,0 // add $0xac,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 15,41,69,232 // movaps %xmm0,-0x18(%ebp)
+ .byte 15,92,211 // subps %xmm3,%xmm2
+ .byte 15,40,93,200 // movaps -0x38(%ebp),%xmm3
+ .byte 15,89,211 // mulps %xmm3,%xmm2
+ .byte 15,88,85,216 // addps -0x28(%ebp),%xmm2
+ .byte 15,87,192 // xorps %xmm0,%xmm0
+ .byte 15,194,197,0 // cmpeqps %xmm5,%xmm0
+ .byte 15,84,232 // andps %xmm0,%xmm5
+ .byte 15,85,194 // andnps %xmm2,%xmm0
+ .byte 15,86,197 // orps %xmm5,%xmm0
+ .byte 15,88,198 // addps %xmm6,%xmm0
+ .byte 15,84,204 // andps %xmm4,%xmm1
+ .byte 15,85,224 // andnps %xmm0,%xmm4
+ .byte 15,86,225 // orps %xmm1,%xmm4
+ .byte 15,40,235 // movaps %xmm3,%xmm5
+ .byte 15,88,109,232 // addps -0x18(%ebp),%xmm5
+ .byte 139,77,12 // mov 0xc(%ebp),%ecx
+ .byte 141,81,4 // lea 0x4(%ecx),%edx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 15,40,69,152 // movaps -0x68(%ebp),%xmm0
+ .byte 15,40,207 // movaps %xmm7,%xmm1
+ .byte 15,40,212 // movaps %xmm4,%xmm2
+ .byte 15,40,221 // movaps %xmm5,%xmm3
+ .byte 82 // push %edx
+ .byte 80 // push %eax
+ .byte 255,17 // call *(%ecx)
+ .byte 129,196,136,0,0,0 // add $0x88,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -50194,133 +49708,116 @@ FUNCTION(_sk_colordodge_sse2)
_sk_colordodge_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 129,236,172,0,0,0 // sub $0xac,%esp
+ .byte 131,236,104 // sub $0x68,%esp
.byte 15,40,251 // movaps %xmm3,%xmm7
- .byte 15,41,85,168 // movaps %xmm2,-0x58(%ebp)
- .byte 15,41,77,184 // movaps %xmm1,-0x48(%ebp)
+ .byte 15,41,85,152 // movaps %xmm2,-0x68(%ebp)
+ .byte 15,41,77,216 // movaps %xmm1,-0x28(%ebp)
+ .byte 232,0,0,0,0 // call ae9 <_sk_colordodge_sse2+0x16>
+ .byte 89 // pop %ecx
+ .byte 139,69,8 // mov 0x8(%ebp),%eax
+ .byte 15,40,104,16 // movaps 0x10(%eax),%xmm5
+ .byte 15,40,177,247,100,0,0 // movaps 0x64f7(%ecx),%xmm6
+ .byte 15,40,222 // movaps %xmm6,%xmm3
+ .byte 15,92,247 // subps %xmm7,%xmm6
+ .byte 15,41,117,184 // movaps %xmm6,-0x48(%ebp)
+ .byte 15,89,245 // mulps %xmm5,%xmm6
+ .byte 15,41,109,200 // movaps %xmm5,-0x38(%ebp)
+ .byte 15,40,213 // movaps %xmm5,%xmm2
+ .byte 15,89,239 // mulps %xmm7,%xmm5
+ .byte 15,40,207 // movaps %xmm7,%xmm1
+ .byte 15,92,200 // subps %xmm0,%xmm1
+ .byte 15,94,233 // divps %xmm1,%xmm5
+ .byte 15,40,96,64 // movaps 0x40(%eax),%xmm4
+ .byte 15,40,204 // movaps %xmm4,%xmm1
+ .byte 15,93,205 // minps %xmm5,%xmm1
+ .byte 15,92,220 // subps %xmm4,%xmm3
+ .byte 15,41,93,232 // movaps %xmm3,-0x18(%ebp)
+ .byte 15,89,216 // mulps %xmm0,%xmm3
+ .byte 15,88,211 // addps %xmm3,%xmm2
+ .byte 15,89,207 // mulps %xmm7,%xmm1
+ .byte 15,88,203 // addps %xmm3,%xmm1
.byte 15,40,232 // movaps %xmm0,%xmm5
- .byte 232,0,0,0,0 // call 1138 <_sk_colordodge_sse2+0x1f>
- .byte 88 // pop %eax
- .byte 15,40,69,88 // movaps 0x58(%ebp),%xmm0
- .byte 15,40,77,40 // movaps 0x28(%ebp),%xmm1
- .byte 15,40,215 // movaps %xmm7,%xmm2
- .byte 15,89,209 // mulps %xmm1,%xmm2
- .byte 15,40,231 // movaps %xmm7,%xmm4
- .byte 15,92,229 // subps %xmm5,%xmm4
- .byte 15,94,212 // divps %xmm4,%xmm2
- .byte 15,40,224 // movaps %xmm0,%xmm4
- .byte 15,93,226 // minps %xmm2,%xmm4
- .byte 15,40,152,152,129,0,0 // movaps 0x8198(%eax),%xmm3
- .byte 15,40,211 // movaps %xmm3,%xmm2
- .byte 15,92,208 // subps %xmm0,%xmm2
- .byte 15,41,85,216 // movaps %xmm2,-0x28(%ebp)
- .byte 15,89,213 // mulps %xmm5,%xmm2
- .byte 15,40,197 // movaps %xmm5,%xmm0
- .byte 15,194,199,0 // cmpeqps %xmm7,%xmm0
- .byte 15,89,231 // mulps %xmm7,%xmm4
- .byte 15,88,226 // addps %xmm2,%xmm4
- .byte 15,84,232 // andps %xmm0,%xmm5
- .byte 15,85,196 // andnps %xmm4,%xmm0
- .byte 15,86,197 // orps %xmm5,%xmm0
- .byte 15,92,223 // subps %xmm7,%xmm3
+ .byte 15,194,239,0 // cmpeqps %xmm7,%xmm5
+ .byte 15,84,197 // andps %xmm5,%xmm0
+ .byte 15,85,233 // andnps %xmm1,%xmm5
+ .byte 15,86,232 // orps %xmm0,%xmm5
+ .byte 15,88,238 // addps %xmm6,%xmm5
+ .byte 15,87,192 // xorps %xmm0,%xmm0
+ .byte 15,40,93,200 // movaps -0x38(%ebp),%xmm3
+ .byte 15,194,216,0 // cmpeqps %xmm0,%xmm3
+ .byte 15,84,211 // andps %xmm3,%xmm2
+ .byte 15,85,221 // andnps %xmm5,%xmm3
+ .byte 15,86,218 // orps %xmm2,%xmm3
.byte 15,41,93,200 // movaps %xmm3,-0x38(%ebp)
- .byte 15,89,217 // mulps %xmm1,%xmm3
- .byte 15,88,195 // addps %xmm3,%xmm0
- .byte 15,87,228 // xorps %xmm4,%xmm4
- .byte 15,40,233 // movaps %xmm1,%xmm5
- .byte 15,194,236,0 // cmpeqps %xmm4,%xmm5
- .byte 15,88,209 // addps %xmm1,%xmm2
- .byte 15,84,213 // andps %xmm5,%xmm2
- .byte 15,85,232 // andnps %xmm0,%xmm5
- .byte 15,86,234 // orps %xmm2,%xmm5
- .byte 15,40,93,56 // movaps 0x38(%ebp),%xmm3
- .byte 15,40,199 // movaps %xmm7,%xmm0
- .byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,40,247 // movaps %xmm7,%xmm6
+ .byte 15,40,64,32 // movaps 0x20(%eax),%xmm0
.byte 15,40,77,184 // movaps -0x48(%ebp),%xmm1
- .byte 15,92,241 // subps %xmm1,%xmm6
- .byte 15,94,198 // divps %xmm6,%xmm0
- .byte 15,40,117,88 // movaps 0x58(%ebp),%xmm6
- .byte 15,93,240 // minps %xmm0,%xmm6
- .byte 15,40,85,216 // movaps -0x28(%ebp),%xmm2
- .byte 15,89,209 // mulps %xmm1,%xmm2
- .byte 15,40,193 // movaps %xmm1,%xmm0
- .byte 15,194,207,0 // cmpeqps %xmm7,%xmm1
- .byte 15,89,247 // mulps %xmm7,%xmm6
- .byte 15,88,242 // addps %xmm2,%xmm6
- .byte 15,84,193 // andps %xmm1,%xmm0
- .byte 15,85,206 // andnps %xmm6,%xmm1
- .byte 15,86,200 // orps %xmm0,%xmm1
- .byte 15,40,117,200 // movaps -0x38(%ebp),%xmm6
- .byte 15,89,243 // mulps %xmm3,%xmm6
- .byte 15,88,206 // addps %xmm6,%xmm1
- .byte 15,40,243 // movaps %xmm3,%xmm6
- .byte 15,194,244,0 // cmpeqps %xmm4,%xmm6
- .byte 15,88,211 // addps %xmm3,%xmm2
- .byte 15,84,214 // andps %xmm6,%xmm2
- .byte 15,85,241 // andnps %xmm1,%xmm6
- .byte 15,86,242 // orps %xmm2,%xmm6
- .byte 15,40,207 // movaps %xmm7,%xmm1
- .byte 15,89,77,72 // mulps 0x48(%ebp),%xmm1
+ .byte 15,89,200 // mulps %xmm0,%xmm1
+ .byte 15,40,232 // movaps %xmm0,%xmm5
+ .byte 15,40,240 // movaps %xmm0,%xmm6
+ .byte 15,89,199 // mulps %xmm7,%xmm0
.byte 15,40,223 // movaps %xmm7,%xmm3
- .byte 15,40,69,168 // movaps -0x58(%ebp),%xmm0
- .byte 15,92,216 // subps %xmm0,%xmm3
- .byte 15,94,203 // divps %xmm3,%xmm1
- .byte 15,40,93,88 // movaps 0x58(%ebp),%xmm3
- .byte 15,93,217 // minps %xmm1,%xmm3
.byte 15,40,85,216 // movaps -0x28(%ebp),%xmm2
- .byte 15,89,208 // mulps %xmm0,%xmm2
- .byte 15,41,85,216 // movaps %xmm2,-0x28(%ebp)
- .byte 15,40,200 // movaps %xmm0,%xmm1
- .byte 15,194,207,0 // cmpeqps %xmm7,%xmm1
+ .byte 15,92,218 // subps %xmm2,%xmm3
+ .byte 15,94,195 // divps %xmm3,%xmm0
+ .byte 15,40,220 // movaps %xmm4,%xmm3
+ .byte 15,93,216 // minps %xmm0,%xmm3
+ .byte 15,40,69,232 // movaps -0x18(%ebp),%xmm0
+ .byte 15,89,194 // mulps %xmm2,%xmm0
+ .byte 15,88,240 // addps %xmm0,%xmm6
.byte 15,89,223 // mulps %xmm7,%xmm3
- .byte 15,88,218 // addps %xmm2,%xmm3
- .byte 15,84,193 // andps %xmm1,%xmm0
- .byte 15,85,203 // andnps %xmm3,%xmm1
- .byte 15,86,200 // orps %xmm0,%xmm1
- .byte 15,40,69,200 // movaps -0x38(%ebp),%xmm0
- .byte 15,40,216 // movaps %xmm0,%xmm3
- .byte 15,40,85,72 // movaps 0x48(%ebp),%xmm2
+ .byte 15,88,216 // addps %xmm0,%xmm3
+ .byte 15,40,194 // movaps %xmm2,%xmm0
+ .byte 15,194,199,0 // cmpeqps %xmm7,%xmm0
+ .byte 15,84,208 // andps %xmm0,%xmm2
+ .byte 15,85,195 // andnps %xmm3,%xmm0
+ .byte 15,86,194 // orps %xmm2,%xmm0
+ .byte 15,88,193 // addps %xmm1,%xmm0
+ .byte 15,87,210 // xorps %xmm2,%xmm2
+ .byte 15,194,234,0 // cmpeqps %xmm2,%xmm5
+ .byte 15,84,245 // andps %xmm5,%xmm6
+ .byte 15,85,232 // andnps %xmm0,%xmm5
+ .byte 15,86,238 // orps %xmm6,%xmm5
+ .byte 15,40,72,48 // movaps 0x30(%eax),%xmm1
+ .byte 15,194,209,0 // cmpeqps %xmm1,%xmm2
+ .byte 15,41,85,216 // movaps %xmm2,-0x28(%ebp)
+ .byte 15,40,85,152 // movaps -0x68(%ebp),%xmm2
+ .byte 15,40,93,232 // movaps -0x18(%ebp),%xmm3
.byte 15,89,218 // mulps %xmm2,%xmm3
- .byte 15,88,203 // addps %xmm3,%xmm1
- .byte 15,194,226,0 // cmpeqps %xmm2,%xmm4
- .byte 15,40,93,216 // movaps -0x28(%ebp),%xmm3
- .byte 15,88,218 // addps %xmm2,%xmm3
- .byte 15,84,220 // andps %xmm4,%xmm3
- .byte 15,85,225 // andnps %xmm1,%xmm4
- .byte 15,86,227 // orps %xmm3,%xmm4
- .byte 15,40,77,88 // movaps 0x58(%ebp),%xmm1
- .byte 15,89,193 // mulps %xmm1,%xmm0
+ .byte 15,41,93,232 // movaps %xmm3,-0x18(%ebp)
+ .byte 15,88,217 // addps %xmm1,%xmm3
+ .byte 15,40,69,184 // movaps -0x48(%ebp),%xmm0
+ .byte 15,40,240 // movaps %xmm0,%xmm6
+ .byte 15,89,241 // mulps %xmm1,%xmm6
+ .byte 15,41,117,168 // movaps %xmm6,-0x58(%ebp)
+ .byte 15,89,207 // mulps %xmm7,%xmm1
+ .byte 15,40,247 // movaps %xmm7,%xmm6
+ .byte 15,92,242 // subps %xmm2,%xmm6
+ .byte 15,94,206 // divps %xmm6,%xmm1
+ .byte 15,89,196 // mulps %xmm4,%xmm0
+ .byte 15,93,225 // minps %xmm1,%xmm4
+ .byte 15,89,231 // mulps %xmm7,%xmm4
+ .byte 15,88,101,232 // addps -0x18(%ebp),%xmm4
+ .byte 15,40,202 // movaps %xmm2,%xmm1
+ .byte 15,194,207,0 // cmpeqps %xmm7,%xmm1
+ .byte 15,84,209 // andps %xmm1,%xmm2
+ .byte 15,85,204 // andnps %xmm4,%xmm1
+ .byte 15,86,202 // orps %xmm2,%xmm1
+ .byte 15,88,77,168 // addps -0x58(%ebp),%xmm1
+ .byte 15,40,85,216 // movaps -0x28(%ebp),%xmm2
+ .byte 15,84,218 // andps %xmm2,%xmm3
+ .byte 15,85,209 // andnps %xmm1,%xmm2
+ .byte 15,86,211 // orps %xmm3,%xmm2
.byte 15,88,248 // addps %xmm0,%xmm7
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
- .byte 139,85,20 // mov 0x14(%ebp),%edx
- .byte 139,117,24 // mov 0x18(%ebp),%esi
- .byte 139,125,12 // mov 0xc(%ebp),%edi
- .byte 141,95,4 // lea 0x4(%edi),%ebx
- .byte 15,41,76,36,80 // movaps %xmm1,0x50(%esp)
- .byte 15,41,84,36,64 // movaps %xmm2,0x40(%esp)
- .byte 15,40,69,56 // movaps 0x38(%ebp),%xmm0
- .byte 15,41,68,36,48 // movaps %xmm0,0x30(%esp)
- .byte 15,40,69,40 // movaps 0x28(%ebp),%xmm0
- .byte 15,41,68,36,32 // movaps %xmm0,0x20(%esp)
- .byte 137,116,36,16 // mov %esi,0x10(%esp)
- .byte 137,84,36,12 // mov %edx,0xc(%esp)
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
- .byte 15,40,197 // movaps %xmm5,%xmm0
- .byte 15,40,206 // movaps %xmm6,%xmm1
- .byte 15,40,212 // movaps %xmm4,%xmm2
+ .byte 139,77,12 // mov 0xc(%ebp),%ecx
+ .byte 141,81,4 // lea 0x4(%ecx),%edx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 15,40,69,200 // movaps -0x38(%ebp),%xmm0
+ .byte 15,40,205 // movaps %xmm5,%xmm1
.byte 15,40,223 // movaps %xmm7,%xmm3
- .byte 255,23 // call *(%edi)
- .byte 129,196,172,0,0,0 // add $0xac,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 82 // push %edx
+ .byte 80 // push %eax
+ .byte 255,17 // call *(%ecx)
+ .byte 131,196,120 // add $0x78,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -50330,124 +49827,106 @@ FUNCTION(_sk_hardlight_sse2)
_sk_hardlight_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 129,236,156,0,0,0 // sub $0x9c,%esp
- .byte 15,40,250 // movaps %xmm2,%xmm7
- .byte 15,40,233 // movaps %xmm1,%xmm5
- .byte 15,40,224 // movaps %xmm0,%xmm4
- .byte 232,0,0,0,0 // call 12da <_sk_hardlight_sse2+0x1a>
- .byte 88 // pop %eax
- .byte 15,40,176,6,128,0,0 // movaps 0x8006(%eax),%xmm6
- .byte 15,40,206 // movaps %xmm6,%xmm1
- .byte 15,92,77,88 // subps 0x58(%ebp),%xmm1
- .byte 15,41,77,184 // movaps %xmm1,-0x48(%ebp)
- .byte 15,40,193 // movaps %xmm1,%xmm0
- .byte 15,89,196 // mulps %xmm4,%xmm0
- .byte 15,40,211 // movaps %xmm3,%xmm2
+ .byte 131,236,88 // sub $0x58,%esp
+ .byte 15,40,243 // movaps %xmm3,%xmm6
+ .byte 15,41,85,168 // movaps %xmm2,-0x58(%ebp)
+ .byte 15,41,77,232 // movaps %xmm1,-0x18(%ebp)
+ .byte 232,0,0,0,0 // call c55 <_sk_hardlight_sse2+0x16>
+ .byte 89 // pop %ecx
+ .byte 139,69,8 // mov 0x8(%ebp),%eax
+ .byte 15,40,72,64 // movaps 0x40(%eax),%xmm1
+ .byte 15,40,145,155,99,0,0 // movaps 0x639b(%ecx),%xmm2
+ .byte 15,40,234 // movaps %xmm2,%xmm5
+ .byte 15,92,233 // subps %xmm1,%xmm5
+ .byte 15,40,225 // movaps %xmm1,%xmm4
+ .byte 15,40,253 // movaps %xmm5,%xmm7
+ .byte 15,89,248 // mulps %xmm0,%xmm7
+ .byte 15,92,214 // subps %xmm6,%xmm2
+ .byte 15,41,85,200 // movaps %xmm2,-0x38(%ebp)
+ .byte 15,40,88,16 // movaps 0x10(%eax),%xmm3
+ .byte 15,40,202 // movaps %xmm2,%xmm1
+ .byte 15,89,203 // mulps %xmm3,%xmm1
+ .byte 15,88,207 // addps %xmm7,%xmm1
+ .byte 15,40,212 // movaps %xmm4,%xmm2
.byte 15,41,85,216 // movaps %xmm2,-0x28(%ebp)
- .byte 15,92,242 // subps %xmm2,%xmm6
- .byte 15,40,222 // movaps %xmm6,%xmm3
- .byte 15,41,93,200 // movaps %xmm3,-0x38(%ebp)
- .byte 15,40,77,40 // movaps 0x28(%ebp),%xmm1
- .byte 15,89,217 // mulps %xmm1,%xmm3
- .byte 15,88,216 // addps %xmm0,%xmm3
- .byte 15,40,242 // movaps %xmm2,%xmm6
- .byte 15,92,244 // subps %xmm4,%xmm6
- .byte 15,40,69,88 // movaps 0x58(%ebp),%xmm0
- .byte 15,92,193 // subps %xmm1,%xmm0
- .byte 15,89,198 // mulps %xmm6,%xmm0
- .byte 15,40,77,216 // movaps -0x28(%ebp),%xmm1
- .byte 15,40,209 // movaps %xmm1,%xmm2
- .byte 15,89,85,88 // mulps 0x58(%ebp),%xmm2
- .byte 15,88,192 // addps %xmm0,%xmm0
- .byte 15,40,242 // movaps %xmm2,%xmm6
- .byte 15,92,240 // subps %xmm0,%xmm6
- .byte 15,40,196 // movaps %xmm4,%xmm0
- .byte 15,88,192 // addps %xmm0,%xmm0
- .byte 15,194,193,2 // cmpleps %xmm1,%xmm0
- .byte 15,89,101,40 // mulps 0x28(%ebp),%xmm4
- .byte 15,88,228 // addps %xmm4,%xmm4
- .byte 15,84,224 // andps %xmm0,%xmm4
- .byte 15,85,198 // andnps %xmm6,%xmm0
- .byte 15,86,196 // orps %xmm4,%xmm0
- .byte 15,88,195 // addps %xmm3,%xmm0
- .byte 15,40,93,184 // movaps -0x48(%ebp),%xmm3
- .byte 15,89,221 // mulps %xmm5,%xmm3
- .byte 15,40,117,200 // movaps -0x38(%ebp),%xmm6
- .byte 15,89,117,56 // mulps 0x38(%ebp),%xmm6
- .byte 15,88,243 // addps %xmm3,%xmm6
- .byte 15,40,217 // movaps %xmm1,%xmm3
- .byte 15,92,221 // subps %xmm5,%xmm3
- .byte 15,40,101,88 // movaps 0x58(%ebp),%xmm4
- .byte 15,92,101,56 // subps 0x38(%ebp),%xmm4
- .byte 15,89,227 // mulps %xmm3,%xmm4
+ .byte 15,40,250 // movaps %xmm2,%xmm7
+ .byte 15,92,251 // subps %xmm3,%xmm7
+ .byte 15,40,230 // movaps %xmm6,%xmm4
+ .byte 15,92,224 // subps %xmm0,%xmm4
+ .byte 15,89,231 // mulps %xmm7,%xmm4
+ .byte 15,40,250 // movaps %xmm2,%xmm7
+ .byte 15,89,254 // mulps %xmm6,%xmm7
+ .byte 15,41,125,184 // movaps %xmm7,-0x48(%ebp)
.byte 15,88,228 // addps %xmm4,%xmm4
- .byte 15,40,218 // movaps %xmm2,%xmm3
- .byte 15,92,220 // subps %xmm4,%xmm3
- .byte 15,40,229 // movaps %xmm5,%xmm4
+ .byte 15,92,252 // subps %xmm4,%xmm7
+ .byte 15,89,216 // mulps %xmm0,%xmm3
+ .byte 15,40,224 // movaps %xmm0,%xmm4
.byte 15,88,228 // addps %xmm4,%xmm4
- .byte 15,194,225,2 // cmpleps %xmm1,%xmm4
- .byte 15,89,109,56 // mulps 0x38(%ebp),%xmm5
- .byte 15,88,237 // addps %xmm5,%xmm5
- .byte 15,84,236 // andps %xmm4,%xmm5
- .byte 15,85,227 // andnps %xmm3,%xmm4
- .byte 15,86,229 // orps %xmm5,%xmm4
- .byte 15,88,230 // addps %xmm6,%xmm4
- .byte 15,40,109,184 // movaps -0x48(%ebp),%xmm5
+ .byte 15,194,230,2 // cmpleps %xmm6,%xmm4
+ .byte 15,88,219 // addps %xmm3,%xmm3
+ .byte 15,84,220 // andps %xmm4,%xmm3
+ .byte 15,85,231 // andnps %xmm7,%xmm4
+ .byte 15,86,227 // orps %xmm3,%xmm4
+ .byte 15,88,225 // addps %xmm1,%xmm4
+ .byte 15,40,205 // movaps %xmm5,%xmm1
+ .byte 15,40,85,232 // movaps -0x18(%ebp),%xmm2
+ .byte 15,89,202 // mulps %xmm2,%xmm1
+ .byte 15,40,88,32 // movaps 0x20(%eax),%xmm3
+ .byte 15,40,69,200 // movaps -0x38(%ebp),%xmm0
+ .byte 15,89,195 // mulps %xmm3,%xmm0
+ .byte 15,88,193 // addps %xmm1,%xmm0
+ .byte 15,40,77,216 // movaps -0x28(%ebp),%xmm1
+ .byte 15,92,203 // subps %xmm3,%xmm1
+ .byte 15,40,254 // movaps %xmm6,%xmm7
+ .byte 15,92,250 // subps %xmm2,%xmm7
+ .byte 15,89,249 // mulps %xmm1,%xmm7
+ .byte 15,88,255 // addps %xmm7,%xmm7
+ .byte 15,40,85,184 // movaps -0x48(%ebp),%xmm2
+ .byte 15,92,215 // subps %xmm7,%xmm2
+ .byte 15,40,77,232 // movaps -0x18(%ebp),%xmm1
+ .byte 15,89,217 // mulps %xmm1,%xmm3
+ .byte 15,88,201 // addps %xmm1,%xmm1
+ .byte 15,194,206,2 // cmpleps %xmm6,%xmm1
+ .byte 15,88,219 // addps %xmm3,%xmm3
+ .byte 15,84,217 // andps %xmm1,%xmm3
+ .byte 15,85,202 // andnps %xmm2,%xmm1
+ .byte 15,86,203 // orps %xmm3,%xmm1
+ .byte 15,88,200 // addps %xmm0,%xmm1
+ .byte 15,40,125,168 // movaps -0x58(%ebp),%xmm7
.byte 15,89,239 // mulps %xmm7,%xmm5
- .byte 15,40,93,72 // movaps 0x48(%ebp),%xmm3
- .byte 15,40,77,200 // movaps -0x38(%ebp),%xmm1
- .byte 15,89,203 // mulps %xmm3,%xmm1
- .byte 15,88,205 // addps %xmm5,%xmm1
- .byte 15,40,109,216 // movaps -0x28(%ebp),%xmm5
- .byte 15,92,239 // subps %xmm7,%xmm5
- .byte 15,40,117,88 // movaps 0x58(%ebp),%xmm6
- .byte 15,92,243 // subps %xmm3,%xmm6
- .byte 15,89,245 // mulps %xmm5,%xmm6
- .byte 15,88,246 // addps %xmm6,%xmm6
- .byte 15,92,214 // subps %xmm6,%xmm2
+ .byte 15,40,80,48 // movaps 0x30(%eax),%xmm2
+ .byte 15,40,93,200 // movaps -0x38(%ebp),%xmm3
+ .byte 15,40,195 // movaps %xmm3,%xmm0
+ .byte 15,89,194 // mulps %xmm2,%xmm0
+ .byte 15,88,197 // addps %xmm5,%xmm0
+ .byte 15,41,69,232 // movaps %xmm0,-0x18(%ebp)
.byte 15,40,239 // movaps %xmm7,%xmm5
.byte 15,88,237 // addps %xmm5,%xmm5
- .byte 15,40,117,216 // movaps -0x28(%ebp),%xmm6
.byte 15,194,238,2 // cmpleps %xmm6,%xmm5
- .byte 15,89,251 // mulps %xmm3,%xmm7
- .byte 15,88,255 // addps %xmm7,%xmm7
- .byte 15,84,253 // andps %xmm5,%xmm7
- .byte 15,85,234 // andnps %xmm2,%xmm5
- .byte 15,86,239 // orps %xmm7,%xmm5
- .byte 15,88,233 // addps %xmm1,%xmm5
- .byte 15,40,85,88 // movaps 0x58(%ebp),%xmm2
- .byte 15,40,93,200 // movaps -0x38(%ebp),%xmm3
- .byte 15,89,218 // mulps %xmm2,%xmm3
- .byte 15,88,243 // addps %xmm3,%xmm6
- .byte 15,40,222 // movaps %xmm6,%xmm3
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
- .byte 139,85,20 // mov 0x14(%ebp),%edx
- .byte 139,117,24 // mov 0x18(%ebp),%esi
- .byte 139,125,12 // mov 0xc(%ebp),%edi
- .byte 141,95,4 // lea 0x4(%edi),%ebx
- .byte 15,41,84,36,80 // movaps %xmm2,0x50(%esp)
- .byte 15,40,77,72 // movaps 0x48(%ebp),%xmm1
- .byte 15,41,76,36,64 // movaps %xmm1,0x40(%esp)
- .byte 15,40,77,56 // movaps 0x38(%ebp),%xmm1
- .byte 15,41,76,36,48 // movaps %xmm1,0x30(%esp)
- .byte 15,40,77,40 // movaps 0x28(%ebp),%xmm1
- .byte 15,41,76,36,32 // movaps %xmm1,0x20(%esp)
- .byte 137,116,36,16 // mov %esi,0x10(%esp)
- .byte 137,84,36,12 // mov %edx,0xc(%esp)
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
- .byte 15,40,204 // movaps %xmm4,%xmm1
+ .byte 15,40,69,216 // movaps -0x28(%ebp),%xmm0
+ .byte 15,89,216 // mulps %xmm0,%xmm3
+ .byte 15,92,194 // subps %xmm2,%xmm0
+ .byte 15,89,215 // mulps %xmm7,%xmm2
+ .byte 15,88,222 // addps %xmm6,%xmm3
+ .byte 15,92,247 // subps %xmm7,%xmm6
+ .byte 15,89,240 // mulps %xmm0,%xmm6
+ .byte 15,88,246 // addps %xmm6,%xmm6
+ .byte 15,40,125,184 // movaps -0x48(%ebp),%xmm7
+ .byte 15,92,254 // subps %xmm6,%xmm7
+ .byte 15,88,210 // addps %xmm2,%xmm2
+ .byte 15,84,213 // andps %xmm5,%xmm2
+ .byte 15,85,239 // andnps %xmm7,%xmm5
+ .byte 15,86,234 // orps %xmm2,%xmm5
+ .byte 15,88,109,232 // addps -0x18(%ebp),%xmm5
+ .byte 139,77,12 // mov 0xc(%ebp),%ecx
+ .byte 141,81,4 // lea 0x4(%ecx),%edx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 15,40,196 // movaps %xmm4,%xmm0
.byte 15,40,213 // movaps %xmm5,%xmm2
- .byte 255,23 // call *(%edi)
- .byte 129,196,156,0,0,0 // add $0x9c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 82 // push %edx
+ .byte 80 // push %eax
+ .byte 255,17 // call *(%ecx)
+ .byte 131,196,104 // add $0x68,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -50457,126 +49936,111 @@ FUNCTION(_sk_overlay_sse2)
_sk_overlay_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 129,236,156,0,0,0 // sub $0x9c,%esp
- .byte 15,41,85,184 // movaps %xmm2,-0x48(%ebp)
- .byte 15,40,224 // movaps %xmm0,%xmm4
- .byte 232,0,0,0,0 // call 1465 <_sk_overlay_sse2+0x18>
- .byte 88 // pop %eax
- .byte 15,40,69,88 // movaps 0x58(%ebp),%xmm0
- .byte 15,40,144,139,126,0,0 // movaps 0x7e8b(%eax),%xmm2
- .byte 15,40,234 // movaps %xmm2,%xmm5
- .byte 15,92,232 // subps %xmm0,%xmm5
- .byte 15,40,248 // movaps %xmm0,%xmm7
- .byte 15,40,197 // movaps %xmm5,%xmm0
- .byte 15,89,196 // mulps %xmm4,%xmm0
- .byte 15,92,211 // subps %xmm3,%xmm2
- .byte 15,41,85,216 // movaps %xmm2,-0x28(%ebp)
- .byte 15,89,85,40 // mulps 0x28(%ebp),%xmm2
- .byte 15,88,208 // addps %xmm0,%xmm2
- .byte 15,40,243 // movaps %xmm3,%xmm6
- .byte 15,41,93,200 // movaps %xmm3,-0x38(%ebp)
- .byte 15,92,244 // subps %xmm4,%xmm6
- .byte 15,40,199 // movaps %xmm7,%xmm0
- .byte 15,40,125,40 // movaps 0x28(%ebp),%xmm7
- .byte 15,92,199 // subps %xmm7,%xmm0
- .byte 15,89,198 // mulps %xmm6,%xmm0
- .byte 15,40,251 // movaps %xmm3,%xmm7
- .byte 15,40,93,88 // movaps 0x58(%ebp),%xmm3
- .byte 15,89,251 // mulps %xmm3,%xmm7
- .byte 15,88,192 // addps %xmm0,%xmm0
- .byte 15,40,247 // movaps %xmm7,%xmm6
- .byte 15,92,240 // subps %xmm0,%xmm6
- .byte 15,40,69,40 // movaps 0x28(%ebp),%xmm0
- .byte 15,88,192 // addps %xmm0,%xmm0
- .byte 15,194,195,2 // cmpleps %xmm3,%xmm0
- .byte 15,89,101,40 // mulps 0x28(%ebp),%xmm4
- .byte 15,88,228 // addps %xmm4,%xmm4
- .byte 15,84,224 // andps %xmm0,%xmm4
- .byte 15,85,198 // andnps %xmm6,%xmm0
- .byte 15,86,196 // orps %xmm4,%xmm0
- .byte 15,88,194 // addps %xmm2,%xmm0
- .byte 15,40,213 // movaps %xmm5,%xmm2
- .byte 15,89,209 // mulps %xmm1,%xmm2
- .byte 15,40,93,216 // movaps -0x28(%ebp),%xmm3
- .byte 15,40,243 // movaps %xmm3,%xmm6
- .byte 15,89,117,56 // mulps 0x38(%ebp),%xmm6
- .byte 15,88,242 // addps %xmm2,%xmm6
- .byte 15,40,85,200 // movaps -0x38(%ebp),%xmm2
- .byte 15,92,209 // subps %xmm1,%xmm2
- .byte 15,40,101,88 // movaps 0x58(%ebp),%xmm4
- .byte 15,40,93,56 // movaps 0x38(%ebp),%xmm3
+ .byte 131,236,104 // sub $0x68,%esp
+ .byte 15,41,93,232 // movaps %xmm3,-0x18(%ebp)
+ .byte 15,41,85,152 // movaps %xmm2,-0x68(%ebp)
+ .byte 15,41,77,168 // movaps %xmm1,-0x58(%ebp)
+ .byte 15,40,232 // movaps %xmm0,%xmm5
+ .byte 232,0,0,0,0 // call da0 <_sk_overlay_sse2+0x1a>
+ .byte 89 // pop %ecx
+ .byte 139,69,8 // mov 0x8(%ebp),%eax
+ .byte 15,40,80,64 // movaps 0x40(%eax),%xmm2
+ .byte 15,40,161,96,98,0,0 // movaps 0x6260(%ecx),%xmm4
+ .byte 15,40,244 // movaps %xmm4,%xmm6
+ .byte 15,92,242 // subps %xmm2,%xmm6
+ .byte 15,40,206 // movaps %xmm6,%xmm1
+ .byte 15,89,205 // mulps %xmm5,%xmm1
.byte 15,92,227 // subps %xmm3,%xmm4
- .byte 15,89,226 // mulps %xmm2,%xmm4
- .byte 15,88,228 // addps %xmm4,%xmm4
- .byte 15,40,215 // movaps %xmm7,%xmm2
- .byte 15,92,212 // subps %xmm4,%xmm2
- .byte 15,40,227 // movaps %xmm3,%xmm4
+ .byte 15,41,101,200 // movaps %xmm4,-0x38(%ebp)
+ .byte 15,40,64,16 // movaps 0x10(%eax),%xmm0
+ .byte 15,40,220 // movaps %xmm4,%xmm3
+ .byte 15,89,216 // mulps %xmm0,%xmm3
+ .byte 15,88,217 // addps %xmm1,%xmm3
+ .byte 15,40,250 // movaps %xmm2,%xmm7
+ .byte 15,92,248 // subps %xmm0,%xmm7
+ .byte 15,41,69,216 // movaps %xmm0,-0x28(%ebp)
+ .byte 15,89,197 // mulps %xmm5,%xmm0
+ .byte 15,40,77,232 // movaps -0x18(%ebp),%xmm1
+ .byte 15,40,225 // movaps %xmm1,%xmm4
+ .byte 15,92,229 // subps %xmm5,%xmm4
+ .byte 15,89,231 // mulps %xmm7,%xmm4
+ .byte 15,40,234 // movaps %xmm2,%xmm5
+ .byte 15,89,233 // mulps %xmm1,%xmm5
+ .byte 15,41,109,184 // movaps %xmm5,-0x48(%ebp)
.byte 15,88,228 // addps %xmm4,%xmm4
- .byte 15,194,101,88,2 // cmpleps 0x58(%ebp),%xmm4
- .byte 15,89,203 // mulps %xmm3,%xmm1
+ .byte 15,92,236 // subps %xmm4,%xmm5
+ .byte 15,40,77,216 // movaps -0x28(%ebp),%xmm1
.byte 15,88,201 // addps %xmm1,%xmm1
- .byte 15,84,204 // andps %xmm4,%xmm1
- .byte 15,85,226 // andnps %xmm2,%xmm4
- .byte 15,86,225 // orps %xmm1,%xmm4
- .byte 15,88,230 // addps %xmm6,%xmm4
- .byte 15,40,117,184 // movaps -0x48(%ebp),%xmm6
- .byte 15,89,238 // mulps %xmm6,%xmm5
- .byte 15,40,85,216 // movaps -0x28(%ebp),%xmm2
- .byte 15,89,85,72 // mulps 0x48(%ebp),%xmm2
- .byte 15,88,213 // addps %xmm5,%xmm2
- .byte 15,40,77,200 // movaps -0x38(%ebp),%xmm1
- .byte 15,40,233 // movaps %xmm1,%xmm5
- .byte 15,92,238 // subps %xmm6,%xmm5
- .byte 15,40,117,88 // movaps 0x58(%ebp),%xmm6
- .byte 15,92,117,72 // subps 0x48(%ebp),%xmm6
- .byte 15,89,245 // mulps %xmm5,%xmm6
- .byte 15,88,246 // addps %xmm6,%xmm6
- .byte 15,92,254 // subps %xmm6,%xmm7
- .byte 15,40,93,72 // movaps 0x48(%ebp),%xmm3
+ .byte 15,194,202,2 // cmpleps %xmm2,%xmm1
+ .byte 15,88,192 // addps %xmm0,%xmm0
+ .byte 15,84,193 // andps %xmm1,%xmm0
+ .byte 15,85,205 // andnps %xmm5,%xmm1
+ .byte 15,86,200 // orps %xmm0,%xmm1
+ .byte 15,88,203 // addps %xmm3,%xmm1
+ .byte 15,41,77,216 // movaps %xmm1,-0x28(%ebp)
+ .byte 15,40,206 // movaps %xmm6,%xmm1
+ .byte 15,40,69,168 // movaps -0x58(%ebp),%xmm0
+ .byte 15,89,200 // mulps %xmm0,%xmm1
+ .byte 15,40,88,32 // movaps 0x20(%eax),%xmm3
+ .byte 15,40,101,200 // movaps -0x38(%ebp),%xmm4
+ .byte 15,89,227 // mulps %xmm3,%xmm4
+ .byte 15,88,225 // addps %xmm1,%xmm4
+ .byte 15,40,202 // movaps %xmm2,%xmm1
+ .byte 15,92,203 // subps %xmm3,%xmm1
.byte 15,40,235 // movaps %xmm3,%xmm5
+ .byte 15,89,216 // mulps %xmm0,%xmm3
+ .byte 15,40,125,232 // movaps -0x18(%ebp),%xmm7
+ .byte 15,92,248 // subps %xmm0,%xmm7
+ .byte 15,89,249 // mulps %xmm1,%xmm7
+ .byte 15,88,255 // addps %xmm7,%xmm7
+ .byte 15,40,77,184 // movaps -0x48(%ebp),%xmm1
+ .byte 15,92,207 // subps %xmm7,%xmm1
.byte 15,88,237 // addps %xmm5,%xmm5
- .byte 15,40,117,88 // movaps 0x58(%ebp),%xmm6
- .byte 15,194,238,2 // cmpleps %xmm6,%xmm5
- .byte 15,40,117,184 // movaps -0x48(%ebp),%xmm6
+ .byte 15,40,250 // movaps %xmm2,%xmm7
+ .byte 15,194,239,2 // cmpleps %xmm7,%xmm5
+ .byte 15,88,219 // addps %xmm3,%xmm3
+ .byte 15,84,221 // andps %xmm5,%xmm3
+ .byte 15,85,233 // andnps %xmm1,%xmm5
+ .byte 15,86,235 // orps %xmm3,%xmm5
+ .byte 15,88,236 // addps %xmm4,%xmm5
+ .byte 15,40,93,152 // movaps -0x68(%ebp),%xmm3
.byte 15,89,243 // mulps %xmm3,%xmm6
+ .byte 15,40,72,48 // movaps 0x30(%eax),%xmm1
+ .byte 15,40,101,200 // movaps -0x38(%ebp),%xmm4
+ .byte 15,40,212 // movaps %xmm4,%xmm2
+ .byte 15,89,209 // mulps %xmm1,%xmm2
+ .byte 15,88,214 // addps %xmm6,%xmm2
+ .byte 15,40,241 // movaps %xmm1,%xmm6
.byte 15,88,246 // addps %xmm6,%xmm6
- .byte 15,84,245 // andps %xmm5,%xmm6
- .byte 15,85,239 // andnps %xmm7,%xmm5
- .byte 15,86,238 // orps %xmm6,%xmm5
- .byte 15,88,234 // addps %xmm2,%xmm5
- .byte 15,40,85,88 // movaps 0x58(%ebp),%xmm2
- .byte 15,40,117,216 // movaps -0x28(%ebp),%xmm6
- .byte 15,89,242 // mulps %xmm2,%xmm6
- .byte 15,40,217 // movaps %xmm1,%xmm3
- .byte 15,88,222 // addps %xmm6,%xmm3
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
- .byte 139,85,20 // mov 0x14(%ebp),%edx
- .byte 139,117,24 // mov 0x18(%ebp),%esi
- .byte 139,125,12 // mov 0xc(%ebp),%edi
- .byte 141,95,4 // lea 0x4(%edi),%ebx
- .byte 15,41,84,36,80 // movaps %xmm2,0x50(%esp)
- .byte 15,40,77,72 // movaps 0x48(%ebp),%xmm1
- .byte 15,41,76,36,64 // movaps %xmm1,0x40(%esp)
- .byte 15,40,77,56 // movaps 0x38(%ebp),%xmm1
- .byte 15,41,76,36,48 // movaps %xmm1,0x30(%esp)
- .byte 15,40,77,40 // movaps 0x28(%ebp),%xmm1
- .byte 15,41,76,36,32 // movaps %xmm1,0x20(%esp)
- .byte 137,116,36,16 // mov %esi,0x10(%esp)
- .byte 137,84,36,12 // mov %edx,0xc(%esp)
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
- .byte 15,40,204 // movaps %xmm4,%xmm1
- .byte 15,40,213 // movaps %xmm5,%xmm2
- .byte 255,23 // call *(%edi)
- .byte 129,196,156,0,0,0 // add $0x9c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 15,194,247,2 // cmpleps %xmm7,%xmm6
+ .byte 15,89,231 // mulps %xmm7,%xmm4
+ .byte 15,92,249 // subps %xmm1,%xmm7
+ .byte 15,40,199 // movaps %xmm7,%xmm0
+ .byte 15,89,203 // mulps %xmm3,%xmm1
+ .byte 15,40,251 // movaps %xmm3,%xmm7
+ .byte 15,40,93,232 // movaps -0x18(%ebp),%xmm3
+ .byte 15,88,227 // addps %xmm3,%xmm4
+ .byte 15,92,223 // subps %xmm7,%xmm3
+ .byte 15,89,216 // mulps %xmm0,%xmm3
+ .byte 15,88,219 // addps %xmm3,%xmm3
+ .byte 15,40,125,184 // movaps -0x48(%ebp),%xmm7
+ .byte 15,92,251 // subps %xmm3,%xmm7
+ .byte 15,88,201 // addps %xmm1,%xmm1
+ .byte 15,84,206 // andps %xmm6,%xmm1
+ .byte 15,85,247 // andnps %xmm7,%xmm6
+ .byte 15,86,241 // orps %xmm1,%xmm6
+ .byte 15,88,242 // addps %xmm2,%xmm6
+ .byte 139,77,12 // mov 0xc(%ebp),%ecx
+ .byte 141,81,4 // lea 0x4(%ecx),%edx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 15,40,69,216 // movaps -0x28(%ebp),%xmm0
+ .byte 15,40,205 // movaps %xmm5,%xmm1
+ .byte 15,40,214 // movaps %xmm6,%xmm2
+ .byte 15,40,220 // movaps %xmm4,%xmm3
+ .byte 82 // push %edx
+ .byte 80 // push %eax
+ .byte 255,17 // call *(%ecx)
+ .byte 131,196,120 // add $0x78,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -50586,219 +50050,206 @@ FUNCTION(_sk_softlight_sse2)
_sk_softlight_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 129,236,12,1,0,0 // sub $0x10c,%esp
- .byte 15,41,93,200 // movaps %xmm3,-0x38(%ebp)
- .byte 15,41,149,72,255,255,255 // movaps %xmm2,-0xb8(%ebp)
- .byte 15,41,141,88,255,255,255 // movaps %xmm1,-0xa8(%ebp)
- .byte 15,40,224 // movaps %xmm0,%xmm4
- .byte 15,40,77,40 // movaps 0x28(%ebp),%xmm1
- .byte 15,40,85,88 // movaps 0x58(%ebp),%xmm2
- .byte 15,87,219 // xorps %xmm3,%xmm3
- .byte 15,194,218,1 // cmpltps %xmm2,%xmm3
- .byte 15,41,93,184 // movaps %xmm3,-0x48(%ebp)
- .byte 15,94,202 // divps %xmm2,%xmm1
- .byte 15,84,203 // andps %xmm3,%xmm1
- .byte 15,40,193 // movaps %xmm1,%xmm0
- .byte 15,88,192 // addps %xmm0,%xmm0
- .byte 15,88,192 // addps %xmm0,%xmm0
- .byte 15,40,208 // movaps %xmm0,%xmm2
- .byte 15,89,210 // mulps %xmm2,%xmm2
+ .byte 129,236,184,0,0,0 // sub $0xb8,%esp
+ .byte 15,41,93,168 // movaps %xmm3,-0x58(%ebp)
+ .byte 15,41,149,88,255,255,255 // movaps %xmm2,-0xa8(%ebp)
+ .byte 15,41,77,136 // movaps %xmm1,-0x78(%ebp)
+ .byte 15,41,69,216 // movaps %xmm0,-0x28(%ebp)
+ .byte 139,69,8 // mov 0x8(%ebp),%eax
+ .byte 15,40,88,64 // movaps 0x40(%eax),%xmm3
+ .byte 15,87,192 // xorps %xmm0,%xmm0
+ .byte 15,194,195,1 // cmpltps %xmm3,%xmm0
+ .byte 15,41,69,200 // movaps %xmm0,-0x38(%ebp)
+ .byte 15,40,104,16 // movaps 0x10(%eax),%xmm5
+ .byte 15,40,213 // movaps %xmm5,%xmm2
+ .byte 15,94,211 // divps %xmm3,%xmm2
+ .byte 15,84,208 // andps %xmm0,%xmm2
+ .byte 15,40,202 // movaps %xmm2,%xmm1
+ .byte 15,88,201 // addps %xmm1,%xmm1
+ .byte 15,88,201 // addps %xmm1,%xmm1
+ .byte 15,40,241 // movaps %xmm1,%xmm6
+ .byte 15,89,246 // mulps %xmm6,%xmm6
+ .byte 15,88,241 // addps %xmm1,%xmm6
+ .byte 232,0,0,0,0 // call f30 <_sk_softlight_sse2+0x52>
+ .byte 89 // pop %ecx
+ .byte 15,40,194 // movaps %xmm2,%xmm0
+ .byte 15,40,137,240,96,0,0 // movaps 0x60f0(%ecx),%xmm1
+ .byte 15,41,141,104,255,255,255 // movaps %xmm1,-0x98(%ebp)
+ .byte 15,88,193 // addps %xmm1,%xmm0
+ .byte 15,89,198 // mulps %xmm6,%xmm0
+ .byte 15,40,185,224,96,0,0 // movaps 0x60e0(%ecx),%xmm7
+ .byte 15,41,125,232 // movaps %xmm7,-0x18(%ebp)
+ .byte 15,92,250 // subps %xmm2,%xmm7
+ .byte 15,82,242 // rsqrtps %xmm2,%xmm6
+ .byte 15,83,206 // rcpps %xmm6,%xmm1
+ .byte 15,92,202 // subps %xmm2,%xmm1
+ .byte 15,40,161,0,97,0,0 // movaps 0x6100(%ecx),%xmm4
+ .byte 15,41,101,152 // movaps %xmm4,-0x68(%ebp)
+ .byte 15,89,212 // mulps %xmm4,%xmm2
.byte 15,88,208 // addps %xmm0,%xmm2
- .byte 232,0,0,0,0 // call 1634 <_sk_softlight_sse2+0x51>
- .byte 88 // pop %eax
- .byte 15,40,233 // movaps %xmm1,%xmm5
- .byte 15,40,128,220,124,0,0 // movaps 0x7cdc(%eax),%xmm0
- .byte 15,41,133,120,255,255,255 // movaps %xmm0,-0x88(%ebp)
- .byte 15,88,232 // addps %xmm0,%xmm5
- .byte 15,89,234 // mulps %xmm2,%xmm5
- .byte 15,40,184,204,124,0,0 // movaps 0x7ccc(%eax),%xmm7
- .byte 15,41,125,216 // movaps %xmm7,-0x28(%ebp)
- .byte 15,92,249 // subps %xmm1,%xmm7
- .byte 15,82,209 // rsqrtps %xmm1,%xmm2
- .byte 15,83,242 // rcpps %xmm2,%xmm6
- .byte 15,92,241 // subps %xmm1,%xmm6
- .byte 15,40,128,236,124,0,0 // movaps 0x7cec(%eax),%xmm0
- .byte 15,41,69,168 // movaps %xmm0,-0x58(%ebp)
- .byte 15,89,200 // mulps %xmm0,%xmm1
- .byte 15,88,205 // addps %xmm5,%xmm1
- .byte 15,40,69,40 // movaps 0x28(%ebp),%xmm0
+ .byte 15,40,197 // movaps %xmm5,%xmm0
.byte 15,88,192 // addps %xmm0,%xmm0
.byte 15,88,192 // addps %xmm0,%xmm0
- .byte 15,40,85,88 // movaps 0x58(%ebp),%xmm2
- .byte 15,194,194,2 // cmpleps %xmm2,%xmm0
- .byte 15,84,200 // andps %xmm0,%xmm1
- .byte 15,85,198 // andnps %xmm6,%xmm0
- .byte 15,86,193 // orps %xmm1,%xmm0
- .byte 15,40,244 // movaps %xmm4,%xmm6
- .byte 15,88,246 // addps %xmm6,%xmm6
- .byte 15,40,238 // movaps %xmm6,%xmm5
- .byte 15,40,93,200 // movaps -0x38(%ebp),%xmm3
- .byte 15,92,235 // subps %xmm3,%xmm5
- .byte 15,89,253 // mulps %xmm5,%xmm7
- .byte 15,89,234 // mulps %xmm2,%xmm5
- .byte 15,89,197 // mulps %xmm5,%xmm0
- .byte 15,40,235 // movaps %xmm3,%xmm5
- .byte 15,40,77,40 // movaps 0x28(%ebp),%xmm1
- .byte 15,89,233 // mulps %xmm1,%xmm5
- .byte 15,88,197 // addps %xmm5,%xmm0
- .byte 15,40,77,216 // movaps -0x28(%ebp),%xmm1
- .byte 15,40,233 // movaps %xmm1,%xmm5
- .byte 15,92,234 // subps %xmm2,%xmm5
- .byte 15,41,109,152 // movaps %xmm5,-0x68(%ebp)
- .byte 15,89,229 // mulps %xmm5,%xmm4
+ .byte 15,40,243 // movaps %xmm3,%xmm6
+ .byte 15,41,117,184 // movaps %xmm6,-0x48(%ebp)
+ .byte 15,194,198,2 // cmpleps %xmm6,%xmm0
+ .byte 15,84,208 // andps %xmm0,%xmm2
+ .byte 15,85,193 // andnps %xmm1,%xmm0
+ .byte 15,86,194 // orps %xmm2,%xmm0
+ .byte 15,40,85,216 // movaps -0x28(%ebp),%xmm2
+ .byte 15,88,210 // addps %xmm2,%xmm2
+ .byte 15,40,202 // movaps %xmm2,%xmm1
+ .byte 15,40,93,168 // movaps -0x58(%ebp),%xmm3
.byte 15,92,203 // subps %xmm3,%xmm1
- .byte 15,41,77,136 // movaps %xmm1,-0x78(%ebp)
- .byte 15,40,233 // movaps %xmm1,%xmm5
- .byte 15,40,77,40 // movaps 0x28(%ebp),%xmm1
- .byte 15,89,233 // mulps %xmm1,%xmm5
- .byte 15,88,229 // addps %xmm5,%xmm4
- .byte 15,40,211 // movaps %xmm3,%xmm2
- .byte 15,88,250 // addps %xmm2,%xmm7
.byte 15,89,249 // mulps %xmm1,%xmm7
- .byte 15,194,242,2 // cmpleps %xmm2,%xmm6
- .byte 15,84,254 // andps %xmm6,%xmm7
- .byte 15,85,240 // andnps %xmm0,%xmm6
- .byte 15,86,247 // orps %xmm7,%xmm6
- .byte 15,88,244 // addps %xmm4,%xmm6
- .byte 15,41,181,104,255,255,255 // movaps %xmm6,-0x98(%ebp)
- .byte 15,40,93,56 // movaps 0x38(%ebp),%xmm3
- .byte 15,40,227 // movaps %xmm3,%xmm4
- .byte 15,40,117,88 // movaps 0x58(%ebp),%xmm6
- .byte 15,94,230 // divps %xmm6,%xmm4
- .byte 15,84,101,184 // andps -0x48(%ebp),%xmm4
- .byte 15,40,196 // movaps %xmm4,%xmm0
- .byte 15,88,192 // addps %xmm0,%xmm0
- .byte 15,88,192 // addps %xmm0,%xmm0
- .byte 15,40,232 // movaps %xmm0,%xmm5
- .byte 15,89,237 // mulps %xmm5,%xmm5
- .byte 15,88,232 // addps %xmm0,%xmm5
- .byte 15,40,196 // movaps %xmm4,%xmm0
- .byte 15,88,133,120,255,255,255 // addps -0x88(%ebp),%xmm0
- .byte 15,89,197 // mulps %xmm5,%xmm0
- .byte 15,40,125,216 // movaps -0x28(%ebp),%xmm7
+ .byte 15,89,206 // mulps %xmm6,%xmm1
+ .byte 15,89,193 // mulps %xmm1,%xmm0
+ .byte 15,40,205 // movaps %xmm5,%xmm1
+ .byte 15,89,203 // mulps %xmm3,%xmm1
+ .byte 15,88,193 // addps %xmm1,%xmm0
+ .byte 15,88,251 // addps %xmm3,%xmm7
+ .byte 15,89,253 // mulps %xmm5,%xmm7
+ .byte 15,40,101,232 // movaps -0x18(%ebp),%xmm4
+ .byte 15,40,204 // movaps %xmm4,%xmm1
+ .byte 15,92,206 // subps %xmm6,%xmm1
+ .byte 15,41,141,120,255,255,255 // movaps %xmm1,-0x88(%ebp)
+ .byte 15,40,117,216 // movaps -0x28(%ebp),%xmm6
+ .byte 15,89,241 // mulps %xmm1,%xmm6
+ .byte 15,92,227 // subps %xmm3,%xmm4
+ .byte 15,41,101,216 // movaps %xmm4,-0x28(%ebp)
+ .byte 15,89,236 // mulps %xmm4,%xmm5
+ .byte 15,88,245 // addps %xmm5,%xmm6
+ .byte 15,40,206 // movaps %xmm6,%xmm1
+ .byte 15,194,211,2 // cmpleps %xmm3,%xmm2
+ .byte 15,40,243 // movaps %xmm3,%xmm6
+ .byte 15,84,250 // andps %xmm2,%xmm7
+ .byte 15,85,208 // andnps %xmm0,%xmm2
+ .byte 15,86,215 // orps %xmm7,%xmm2
+ .byte 15,88,209 // addps %xmm1,%xmm2
+ .byte 15,41,149,72,255,255,255 // movaps %xmm2,-0xb8(%ebp)
+ .byte 15,40,64,32 // movaps 0x20(%eax),%xmm0
+ .byte 15,40,224 // movaps %xmm0,%xmm4
+ .byte 15,94,101,184 // divps -0x48(%ebp),%xmm4
+ .byte 15,84,101,200 // andps -0x38(%ebp),%xmm4
+ .byte 15,40,204 // movaps %xmm4,%xmm1
+ .byte 15,88,201 // addps %xmm1,%xmm1
+ .byte 15,88,201 // addps %xmm1,%xmm1
+ .byte 15,40,217 // movaps %xmm1,%xmm3
+ .byte 15,89,219 // mulps %xmm3,%xmm3
+ .byte 15,88,217 // addps %xmm1,%xmm3
+ .byte 15,40,204 // movaps %xmm4,%xmm1
+ .byte 15,88,141,104,255,255,255 // addps -0x98(%ebp),%xmm1
+ .byte 15,89,203 // mulps %xmm3,%xmm1
+ .byte 15,40,125,232 // movaps -0x18(%ebp),%xmm7
.byte 15,92,252 // subps %xmm4,%xmm7
- .byte 15,82,236 // rsqrtps %xmm4,%xmm5
- .byte 15,83,237 // rcpps %xmm5,%xmm5
+ .byte 15,82,220 // rsqrtps %xmm4,%xmm3
+ .byte 15,83,235 // rcpps %xmm3,%xmm5
.byte 15,92,236 // subps %xmm4,%xmm5
- .byte 15,89,101,168 // mulps -0x58(%ebp),%xmm4
- .byte 15,88,224 // addps %xmm0,%xmm4
- .byte 15,40,195 // movaps %xmm3,%xmm0
+ .byte 15,89,101,152 // mulps -0x68(%ebp),%xmm4
+ .byte 15,88,225 // addps %xmm1,%xmm4
+ .byte 15,40,93,136 // movaps -0x78(%ebp),%xmm3
+ .byte 15,88,219 // addps %xmm3,%xmm3
+ .byte 15,40,203 // movaps %xmm3,%xmm1
+ .byte 15,92,206 // subps %xmm6,%xmm1
+ .byte 15,89,249 // mulps %xmm1,%xmm7
+ .byte 15,88,254 // addps %xmm6,%xmm7
+ .byte 15,89,248 // mulps %xmm0,%xmm7
+ .byte 15,40,117,216 // movaps -0x28(%ebp),%xmm6
+ .byte 15,89,240 // mulps %xmm0,%xmm6
+ .byte 15,40,208 // movaps %xmm0,%xmm2
.byte 15,88,192 // addps %xmm0,%xmm0
.byte 15,88,192 // addps %xmm0,%xmm0
- .byte 15,194,198,2 // cmpleps %xmm6,%xmm0
+ .byte 15,194,69,184,2 // cmpleps -0x48(%ebp),%xmm0
.byte 15,84,224 // andps %xmm0,%xmm4
.byte 15,85,197 // andnps %xmm5,%xmm0
.byte 15,86,196 // orps %xmm4,%xmm0
- .byte 15,40,141,88,255,255,255 // movaps -0xa8(%ebp),%xmm1
- .byte 15,40,225 // movaps %xmm1,%xmm4
- .byte 15,88,228 // addps %xmm4,%xmm4
- .byte 15,40,236 // movaps %xmm4,%xmm5
- .byte 15,92,234 // subps %xmm2,%xmm5
- .byte 15,89,253 // mulps %xmm5,%xmm7
- .byte 15,89,238 // mulps %xmm6,%xmm5
- .byte 15,89,197 // mulps %xmm5,%xmm0
- .byte 15,40,234 // movaps %xmm2,%xmm5
- .byte 15,89,235 // mulps %xmm3,%xmm5
- .byte 15,88,197 // addps %xmm5,%xmm0
- .byte 15,89,77,152 // mulps -0x68(%ebp),%xmm1
- .byte 15,40,109,136 // movaps -0x78(%ebp),%xmm5
- .byte 15,89,235 // mulps %xmm3,%xmm5
- .byte 15,88,205 // addps %xmm5,%xmm1
- .byte 15,40,233 // movaps %xmm1,%xmm5
- .byte 15,88,250 // addps %xmm2,%xmm7
- .byte 15,89,251 // mulps %xmm3,%xmm7
- .byte 15,194,226,2 // cmpleps %xmm2,%xmm4
- .byte 15,84,252 // andps %xmm4,%xmm7
- .byte 15,85,224 // andnps %xmm0,%xmm4
- .byte 15,86,231 // orps %xmm7,%xmm4
- .byte 15,88,229 // addps %xmm5,%xmm4
- .byte 15,40,125,72 // movaps 0x48(%ebp),%xmm7
- .byte 15,94,254 // divps %xmm6,%xmm7
- .byte 15,84,125,184 // andps -0x48(%ebp),%xmm7
- .byte 15,40,93,216 // movaps -0x28(%ebp),%xmm3
- .byte 15,92,223 // subps %xmm7,%xmm3
- .byte 15,40,149,120,255,255,255 // movaps -0x88(%ebp),%xmm2
- .byte 15,88,215 // addps %xmm7,%xmm2
- .byte 15,40,77,168 // movaps -0x58(%ebp),%xmm1
- .byte 15,89,207 // mulps %xmm7,%xmm1
- .byte 15,82,199 // rsqrtps %xmm7,%xmm0
- .byte 15,83,192 // rcpps %xmm0,%xmm0
- .byte 15,92,199 // subps %xmm7,%xmm0
+ .byte 15,40,101,184 // movaps -0x48(%ebp),%xmm4
+ .byte 15,89,204 // mulps %xmm4,%xmm1
+ .byte 15,89,193 // mulps %xmm1,%xmm0
+ .byte 15,40,109,168 // movaps -0x58(%ebp),%xmm5
+ .byte 15,89,213 // mulps %xmm5,%xmm2
+ .byte 15,88,194 // addps %xmm2,%xmm0
+ .byte 15,40,77,136 // movaps -0x78(%ebp),%xmm1
+ .byte 15,89,141,120,255,255,255 // mulps -0x88(%ebp),%xmm1
+ .byte 15,88,206 // addps %xmm6,%xmm1
+ .byte 15,194,221,2 // cmpleps %xmm5,%xmm3
+ .byte 15,40,245 // movaps %xmm5,%xmm6
+ .byte 15,84,251 // andps %xmm3,%xmm7
+ .byte 15,85,216 // andnps %xmm0,%xmm3
+ .byte 15,86,223 // orps %xmm7,%xmm3
+ .byte 15,88,217 // addps %xmm1,%xmm3
+ .byte 15,40,64,48 // movaps 0x30(%eax),%xmm0
+ .byte 15,40,248 // movaps %xmm0,%xmm7
+ .byte 15,94,252 // divps %xmm4,%xmm7
+ .byte 15,84,125,200 // andps -0x38(%ebp),%xmm7
+ .byte 15,40,77,232 // movaps -0x18(%ebp),%xmm1
+ .byte 15,92,207 // subps %xmm7,%xmm1
+ .byte 15,41,77,232 // movaps %xmm1,-0x18(%ebp)
+ .byte 15,40,173,104,255,255,255 // movaps -0x98(%ebp),%xmm5
+ .byte 15,88,239 // addps %xmm7,%xmm5
+ .byte 15,40,101,152 // movaps -0x68(%ebp),%xmm4
+ .byte 15,89,231 // mulps %xmm7,%xmm4
+ .byte 15,82,207 // rsqrtps %xmm7,%xmm1
+ .byte 15,83,201 // rcpps %xmm1,%xmm1
+ .byte 15,92,207 // subps %xmm7,%xmm1
+ .byte 15,41,77,200 // movaps %xmm1,-0x38(%ebp)
.byte 15,88,255 // addps %xmm7,%xmm7
.byte 15,88,255 // addps %xmm7,%xmm7
- .byte 15,40,239 // movaps %xmm7,%xmm5
- .byte 15,89,237 // mulps %xmm5,%xmm5
- .byte 15,88,239 // addps %xmm7,%xmm5
- .byte 15,40,250 // movaps %xmm2,%xmm7
- .byte 15,89,253 // mulps %xmm5,%xmm7
- .byte 15,40,209 // movaps %xmm1,%xmm2
+ .byte 15,40,215 // movaps %xmm7,%xmm2
+ .byte 15,89,210 // mulps %xmm2,%xmm2
.byte 15,88,215 // addps %xmm7,%xmm2
- .byte 15,40,109,72 // movaps 0x48(%ebp),%xmm5
- .byte 15,88,237 // addps %xmm5,%xmm5
+ .byte 15,40,205 // movaps %xmm5,%xmm1
+ .byte 15,89,202 // mulps %xmm2,%xmm1
+ .byte 15,88,225 // addps %xmm1,%xmm4
+ .byte 15,40,204 // movaps %xmm4,%xmm1
+ .byte 15,40,173,88,255,255,255 // movaps -0xa8(%ebp),%xmm5
.byte 15,88,237 // addps %xmm5,%xmm5
- .byte 15,194,238,2 // cmpleps %xmm6,%xmm5
+ .byte 15,40,213 // movaps %xmm5,%xmm2
+ .byte 15,92,214 // subps %xmm6,%xmm2
+ .byte 15,40,101,232 // movaps -0x18(%ebp),%xmm4
+ .byte 15,89,226 // mulps %xmm2,%xmm4
+ .byte 15,88,230 // addps %xmm6,%xmm4
+ .byte 15,89,224 // mulps %xmm0,%xmm4
+ .byte 15,41,101,232 // movaps %xmm4,-0x18(%ebp)
+ .byte 15,40,101,216 // movaps -0x28(%ebp),%xmm4
+ .byte 15,89,224 // mulps %xmm0,%xmm4
+ .byte 15,40,240 // movaps %xmm0,%xmm6
+ .byte 15,88,192 // addps %xmm0,%xmm0
+ .byte 15,88,192 // addps %xmm0,%xmm0
+ .byte 15,40,125,184 // movaps -0x48(%ebp),%xmm7
+ .byte 15,194,199,2 // cmpleps %xmm7,%xmm0
+ .byte 15,84,200 // andps %xmm0,%xmm1
+ .byte 15,85,69,200 // andnps -0x38(%ebp),%xmm0
+ .byte 15,86,193 // orps %xmm1,%xmm0
+ .byte 15,89,215 // mulps %xmm7,%xmm2
+ .byte 15,89,194 // mulps %xmm2,%xmm0
+ .byte 15,40,85,168 // movaps -0x58(%ebp),%xmm2
+ .byte 15,89,242 // mulps %xmm2,%xmm6
+ .byte 15,88,198 // addps %xmm6,%xmm0
+ .byte 15,40,141,88,255,255,255 // movaps -0xa8(%ebp),%xmm1
+ .byte 15,89,141,120,255,255,255 // mulps -0x88(%ebp),%xmm1
+ .byte 15,88,204 // addps %xmm4,%xmm1
+ .byte 15,194,234,2 // cmpleps %xmm2,%xmm5
+ .byte 15,40,226 // movaps %xmm2,%xmm4
+ .byte 15,40,85,232 // movaps -0x18(%ebp),%xmm2
.byte 15,84,213 // andps %xmm5,%xmm2
.byte 15,85,232 // andnps %xmm0,%xmm5
.byte 15,86,234 // orps %xmm2,%xmm5
+ .byte 15,88,233 // addps %xmm1,%xmm5
+ .byte 15,40,69,216 // movaps -0x28(%ebp),%xmm0
+ .byte 15,89,199 // mulps %xmm7,%xmm0
+ .byte 15,88,224 // addps %xmm0,%xmm4
+ .byte 139,77,12 // mov 0xc(%ebp),%ecx
+ .byte 141,81,4 // lea 0x4(%ecx),%edx
+ .byte 131,236,8 // sub $0x8,%esp
.byte 15,40,133,72,255,255,255 // movaps -0xb8(%ebp),%xmm0
- .byte 15,40,77,152 // movaps -0x68(%ebp),%xmm1
- .byte 15,89,200 // mulps %xmm0,%xmm1
- .byte 15,40,208 // movaps %xmm0,%xmm2
- .byte 15,88,210 // addps %xmm2,%xmm2
- .byte 15,40,194 // movaps %xmm2,%xmm0
- .byte 15,40,125,200 // movaps -0x38(%ebp),%xmm7
- .byte 15,92,199 // subps %xmm7,%xmm0
- .byte 15,89,216 // mulps %xmm0,%xmm3
- .byte 15,41,93,216 // movaps %xmm3,-0x28(%ebp)
- .byte 15,89,198 // mulps %xmm6,%xmm0
- .byte 15,89,232 // mulps %xmm0,%xmm5
- .byte 15,40,199 // movaps %xmm7,%xmm0
- .byte 15,40,93,72 // movaps 0x48(%ebp),%xmm3
- .byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,232 // addps %xmm0,%xmm5
- .byte 15,40,117,136 // movaps -0x78(%ebp),%xmm6
- .byte 15,40,198 // movaps %xmm6,%xmm0
- .byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,193 // addps %xmm1,%xmm0
- .byte 15,40,77,216 // movaps -0x28(%ebp),%xmm1
- .byte 15,88,207 // addps %xmm7,%xmm1
- .byte 15,89,203 // mulps %xmm3,%xmm1
- .byte 15,194,215,2 // cmpleps %xmm7,%xmm2
- .byte 15,84,202 // andps %xmm2,%xmm1
- .byte 15,85,213 // andnps %xmm5,%xmm2
- .byte 15,86,209 // orps %xmm1,%xmm2
- .byte 15,88,208 // addps %xmm0,%xmm2
- .byte 15,40,69,88 // movaps 0x58(%ebp),%xmm0
- .byte 15,89,240 // mulps %xmm0,%xmm6
- .byte 15,88,254 // addps %xmm6,%xmm7
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
- .byte 139,85,20 // mov 0x14(%ebp),%edx
- .byte 139,117,24 // mov 0x18(%ebp),%esi
- .byte 139,125,12 // mov 0xc(%ebp),%edi
- .byte 141,95,4 // lea 0x4(%edi),%ebx
- .byte 15,41,68,36,80 // movaps %xmm0,0x50(%esp)
- .byte 15,41,92,36,64 // movaps %xmm3,0x40(%esp)
- .byte 15,40,69,56 // movaps 0x38(%ebp),%xmm0
- .byte 15,41,68,36,48 // movaps %xmm0,0x30(%esp)
- .byte 15,40,69,40 // movaps 0x28(%ebp),%xmm0
- .byte 15,41,68,36,32 // movaps %xmm0,0x20(%esp)
- .byte 137,116,36,16 // mov %esi,0x10(%esp)
- .byte 137,84,36,12 // mov %edx,0xc(%esp)
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
- .byte 15,40,133,104,255,255,255 // movaps -0x98(%ebp),%xmm0
- .byte 15,40,204 // movaps %xmm4,%xmm1
- .byte 15,40,223 // movaps %xmm7,%xmm3
- .byte 255,23 // call *(%edi)
- .byte 129,196,12,1,0,0 // add $0x10c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 15,40,203 // movaps %xmm3,%xmm1
+ .byte 15,40,213 // movaps %xmm5,%xmm2
+ .byte 15,40,220 // movaps %xmm4,%xmm3
+ .byte 82 // push %edx
+ .byte 80 // push %eax
+ .byte 255,17 // call *(%ecx)
+ .byte 129,196,200,0,0,0 // add $0xc8,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -50808,233 +50259,223 @@ FUNCTION(_sk_hue_sse2)
_sk_hue_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 129,236,236,0,0,0 // sub $0xec,%esp
- .byte 15,40,243 // movaps %xmm3,%xmm6
- .byte 15,41,85,216 // movaps %xmm2,-0x28(%ebp)
- .byte 15,40,85,40 // movaps 0x28(%ebp),%xmm2
- .byte 15,40,101,72 // movaps 0x48(%ebp),%xmm4
- .byte 15,40,109,56 // movaps 0x38(%ebp),%xmm5
- .byte 15,40,253 // movaps %xmm5,%xmm7
- .byte 15,95,252 // maxps %xmm4,%xmm7
- .byte 15,40,218 // movaps %xmm2,%xmm3
- .byte 15,95,223 // maxps %xmm7,%xmm3
- .byte 15,40,253 // movaps %xmm5,%xmm7
- .byte 15,93,252 // minps %xmm4,%xmm7
+ .byte 129,236,184,0,0,0 // sub $0xb8,%esp
+ .byte 15,40,251 // movaps %xmm3,%xmm7
+ .byte 15,41,85,232 // movaps %xmm2,-0x18(%ebp)
+ .byte 15,40,241 // movaps %xmm1,%xmm6
+ .byte 15,40,232 // movaps %xmm0,%xmm5
+ .byte 139,69,8 // mov 0x8(%ebp),%eax
+ .byte 15,40,72,16 // movaps 0x10(%eax),%xmm1
+ .byte 15,40,64,32 // movaps 0x20(%eax),%xmm0
+ .byte 15,41,69,136 // movaps %xmm0,-0x78(%ebp)
+ .byte 15,40,88,48 // movaps 0x30(%eax),%xmm3
+ .byte 15,41,93,200 // movaps %xmm3,-0x38(%ebp)
+ .byte 15,40,208 // movaps %xmm0,%xmm2
+ .byte 15,95,211 // maxps %xmm3,%xmm2
+ .byte 15,40,225 // movaps %xmm1,%xmm4
+ .byte 15,41,77,152 // movaps %xmm1,-0x68(%ebp)
+ .byte 15,95,226 // maxps %xmm2,%xmm4
+ .byte 15,93,195 // minps %xmm3,%xmm0
+ .byte 15,93,200 // minps %xmm0,%xmm1
+ .byte 15,92,225 // subps %xmm1,%xmm4
+ .byte 15,41,101,168 // movaps %xmm4,-0x58(%ebp)
+ .byte 232,0,0,0,0 // call 11f1 <_sk_hue_sse2+0x4f>
+ .byte 89 // pop %ecx
+ .byte 15,40,221 // movaps %xmm5,%xmm3
+ .byte 15,40,197 // movaps %xmm5,%xmm0
+ .byte 15,89,223 // mulps %xmm7,%xmm3
+ .byte 15,40,214 // movaps %xmm6,%xmm2
+ .byte 15,89,215 // mulps %xmm7,%xmm2
.byte 15,40,226 // movaps %xmm2,%xmm4
- .byte 15,93,231 // minps %xmm7,%xmm4
- .byte 15,92,220 // subps %xmm4,%xmm3
- .byte 232,0,0,0,0 // call 1905 <_sk_hue_sse2+0x3f>
- .byte 88 // pop %eax
- .byte 15,40,224 // movaps %xmm0,%xmm4
- .byte 15,89,230 // mulps %xmm6,%xmm4
- .byte 15,41,101,200 // movaps %xmm4,-0x38(%ebp)
- .byte 15,40,233 // movaps %xmm1,%xmm5
- .byte 15,89,238 // mulps %xmm6,%xmm5
- .byte 15,40,184,91,122,0,0 // movaps 0x7a5b(%eax),%xmm7
- .byte 15,41,125,168 // movaps %xmm7,-0x58(%ebp)
- .byte 15,92,125,88 // subps 0x58(%ebp),%xmm7
- .byte 15,89,199 // mulps %xmm7,%xmm0
- .byte 15,41,133,104,255,255,255 // movaps %xmm0,-0x98(%ebp)
- .byte 15,89,207 // mulps %xmm7,%xmm1
- .byte 15,41,141,120,255,255,255 // movaps %xmm1,-0x88(%ebp)
- .byte 15,40,69,216 // movaps -0x28(%ebp),%xmm0
- .byte 15,89,248 // mulps %xmm0,%xmm7
- .byte 15,41,125,136 // movaps %xmm7,-0x78(%ebp)
- .byte 15,40,230 // movaps %xmm6,%xmm4
- .byte 15,41,101,184 // movaps %xmm4,-0x48(%ebp)
- .byte 15,89,196 // mulps %xmm4,%xmm0
+ .byte 15,40,72,64 // movaps 0x40(%eax),%xmm1
+ .byte 15,41,77,216 // movaps %xmm1,-0x28(%ebp)
+ .byte 15,40,169,127,94,0,0 // movaps 0x5e7f(%ecx),%xmm5
+ .byte 15,92,233 // subps %xmm1,%xmm5
+ .byte 15,89,197 // mulps %xmm5,%xmm0
+ .byte 15,41,133,72,255,255,255 // movaps %xmm0,-0xb8(%ebp)
+ .byte 15,89,245 // mulps %xmm5,%xmm6
+ .byte 15,41,181,104,255,255,255 // movaps %xmm6,-0x98(%ebp)
+ .byte 15,40,69,232 // movaps -0x18(%ebp),%xmm0
+ .byte 15,89,232 // mulps %xmm0,%xmm5
+ .byte 15,41,173,88,255,255,255 // movaps %xmm5,-0xa8(%ebp)
+ .byte 15,40,215 // movaps %xmm7,%xmm2
+ .byte 15,41,85,184 // movaps %xmm2,-0x48(%ebp)
+ .byte 15,89,194 // mulps %xmm2,%xmm0
+ .byte 15,40,236 // movaps %xmm4,%xmm5
.byte 15,40,205 // movaps %xmm5,%xmm1
.byte 15,93,200 // minps %xmm0,%xmm1
- .byte 15,40,117,200 // movaps -0x38(%ebp),%xmm6
+ .byte 15,40,243 // movaps %xmm3,%xmm6
.byte 15,40,254 // movaps %xmm6,%xmm7
.byte 15,93,249 // minps %xmm1,%xmm7
.byte 15,40,205 // movaps %xmm5,%xmm1
.byte 15,95,200 // maxps %xmm0,%xmm1
- .byte 15,40,214 // movaps %xmm6,%xmm2
- .byte 15,95,209 // maxps %xmm1,%xmm2
- .byte 15,92,215 // subps %xmm7,%xmm2
+ .byte 15,40,230 // movaps %xmm6,%xmm4
+ .byte 15,95,225 // maxps %xmm1,%xmm4
+ .byte 15,92,231 // subps %xmm7,%xmm4
.byte 15,92,247 // subps %xmm7,%xmm6
.byte 15,92,239 // subps %xmm7,%xmm5
.byte 15,92,199 // subps %xmm7,%xmm0
- .byte 15,89,220 // mulps %xmm4,%xmm3
- .byte 15,89,243 // mulps %xmm3,%xmm6
- .byte 15,89,235 // mulps %xmm3,%xmm5
- .byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,40,152,43,122,0,0 // movaps 0x7a2b(%eax),%xmm3
- .byte 15,41,93,216 // movaps %xmm3,-0x28(%ebp)
- .byte 15,40,77,40 // movaps 0x28(%ebp),%xmm1
+ .byte 15,40,77,168 // movaps -0x58(%ebp),%xmm1
+ .byte 15,89,202 // mulps %xmm2,%xmm1
+ .byte 15,89,241 // mulps %xmm1,%xmm6
+ .byte 15,40,214 // movaps %xmm6,%xmm2
+ .byte 15,89,233 // mulps %xmm1,%xmm5
+ .byte 15,41,173,120,255,255,255 // movaps %xmm5,-0x88(%ebp)
+ .byte 15,89,193 // mulps %xmm1,%xmm0
+ .byte 15,40,153,79,94,0,0 // movaps 0x5e4f(%ecx),%xmm3
+ .byte 15,41,93,232 // movaps %xmm3,-0x18(%ebp)
+ .byte 15,40,117,152 // movaps -0x68(%ebp),%xmm6
+ .byte 15,40,206 // movaps %xmm6,%xmm1
.byte 15,89,203 // mulps %xmm3,%xmm1
- .byte 15,40,160,59,122,0,0 // movaps 0x7a3b(%eax),%xmm4
- .byte 15,40,125,56 // movaps 0x38(%ebp),%xmm7
- .byte 15,89,252 // mulps %xmm4,%xmm7
+ .byte 15,40,153,95,94,0,0 // movaps 0x5e5f(%ecx),%xmm3
+ .byte 15,40,109,136 // movaps -0x78(%ebp),%xmm5
+ .byte 15,40,253 // movaps %xmm5,%xmm7
+ .byte 15,89,251 // mulps %xmm3,%xmm7
.byte 15,88,249 // addps %xmm1,%xmm7
- .byte 15,40,152,75,122,0,0 // movaps 0x7a4b(%eax),%xmm3
- .byte 15,40,77,72 // movaps 0x48(%ebp),%xmm1
- .byte 15,89,203 // mulps %xmm3,%xmm1
+ .byte 15,40,137,127,94,0,0 // movaps 0x5e7f(%ecx),%xmm1
+ .byte 15,92,77,184 // subps -0x48(%ebp),%xmm1
+ .byte 15,89,241 // mulps %xmm1,%xmm6
+ .byte 15,41,117,152 // movaps %xmm6,-0x68(%ebp)
+ .byte 15,89,233 // mulps %xmm1,%xmm5
+ .byte 15,41,109,136 // movaps %xmm5,-0x78(%ebp)
+ .byte 15,40,241 // movaps %xmm1,%xmm6
+ .byte 15,40,77,200 // movaps -0x38(%ebp),%xmm1
+ .byte 15,89,241 // mulps %xmm1,%xmm6
+ .byte 15,41,117,168 // movaps %xmm6,-0x58(%ebp)
+ .byte 15,40,169,111,94,0,0 // movaps 0x5e6f(%ecx),%xmm5
+ .byte 15,89,205 // mulps %xmm5,%xmm1
.byte 15,88,207 // addps %xmm7,%xmm1
- .byte 15,94,242 // divps %xmm2,%xmm6
- .byte 15,40,253 // movaps %xmm5,%xmm7
- .byte 15,94,250 // divps %xmm2,%xmm7
- .byte 15,94,194 // divps %xmm2,%xmm0
- .byte 15,87,237 // xorps %xmm5,%xmm5
- .byte 15,194,213,4 // cmpneqps %xmm5,%xmm2
- .byte 15,84,242 // andps %xmm2,%xmm6
- .byte 15,84,250 // andps %xmm2,%xmm7
- .byte 15,40,239 // movaps %xmm7,%xmm5
- .byte 15,84,208 // andps %xmm0,%xmm2
- .byte 15,40,198 // movaps %xmm6,%xmm0
- .byte 15,89,69,216 // mulps -0x28(%ebp),%xmm0
- .byte 15,89,252 // mulps %xmm4,%xmm7
- .byte 15,88,248 // addps %xmm0,%xmm7
+ .byte 15,94,212 // divps %xmm4,%xmm2
+ .byte 15,40,181,120,255,255,255 // movaps -0x88(%ebp),%xmm6
+ .byte 15,94,244 // divps %xmm4,%xmm6
+ .byte 15,94,196 // divps %xmm4,%xmm0
+ .byte 15,87,255 // xorps %xmm7,%xmm7
+ .byte 15,194,231,4 // cmpneqps %xmm7,%xmm4
+ .byte 15,84,212 // andps %xmm4,%xmm2
+ .byte 15,84,244 // andps %xmm4,%xmm6
+ .byte 15,84,224 // andps %xmm0,%xmm4
.byte 15,40,194 // movaps %xmm2,%xmm0
- .byte 15,89,195 // mulps %xmm3,%xmm0
+ .byte 15,89,69,232 // mulps -0x18(%ebp),%xmm0
+ .byte 15,40,254 // movaps %xmm6,%xmm7
+ .byte 15,89,251 // mulps %xmm3,%xmm7
+ .byte 15,88,248 // addps %xmm0,%xmm7
+ .byte 15,40,196 // movaps %xmm4,%xmm0
+ .byte 15,89,197 // mulps %xmm5,%xmm0
.byte 15,88,199 // addps %xmm7,%xmm0
.byte 15,89,77,184 // mulps -0x48(%ebp),%xmm1
.byte 15,92,200 // subps %xmm0,%xmm1
+ .byte 15,88,209 // addps %xmm1,%xmm2
.byte 15,88,241 // addps %xmm1,%xmm6
- .byte 15,40,253 // movaps %xmm5,%xmm7
- .byte 15,88,249 // addps %xmm1,%xmm7
- .byte 15,88,202 // addps %xmm2,%xmm1
- .byte 15,40,199 // movaps %xmm7,%xmm0
+ .byte 15,88,204 // addps %xmm4,%xmm1
+ .byte 15,40,198 // movaps %xmm6,%xmm0
.byte 15,93,193 // minps %xmm1,%xmm0
- .byte 15,40,214 // movaps %xmm6,%xmm2
- .byte 15,93,208 // minps %xmm0,%xmm2
- .byte 15,40,199 // movaps %xmm7,%xmm0
- .byte 15,40,239 // movaps %xmm7,%xmm5
- .byte 15,41,109,200 // movaps %xmm5,-0x38(%ebp)
+ .byte 15,40,226 // movaps %xmm2,%xmm4
+ .byte 15,93,224 // minps %xmm0,%xmm4
+ .byte 15,40,198 // movaps %xmm6,%xmm0
.byte 15,95,193 // maxps %xmm1,%xmm0
- .byte 15,40,254 // movaps %xmm6,%xmm7
+ .byte 15,40,250 // movaps %xmm2,%xmm7
.byte 15,95,248 // maxps %xmm0,%xmm7
- .byte 15,40,69,216 // movaps -0x28(%ebp),%xmm0
- .byte 15,89,198 // mulps %xmm6,%xmm0
- .byte 15,89,229 // mulps %xmm5,%xmm4
- .byte 15,88,224 // addps %xmm0,%xmm4
- .byte 15,89,217 // mulps %xmm1,%xmm3
- .byte 15,88,220 // addps %xmm4,%xmm3
+ .byte 15,40,69,232 // movaps -0x18(%ebp),%xmm0
+ .byte 15,89,194 // mulps %xmm2,%xmm0
+ .byte 15,89,222 // mulps %xmm6,%xmm3
+ .byte 15,88,216 // addps %xmm0,%xmm3
+ .byte 15,89,233 // mulps %xmm1,%xmm5
+ .byte 15,88,235 // addps %xmm3,%xmm5
.byte 15,87,192 // xorps %xmm0,%xmm0
- .byte 15,194,194,2 // cmpleps %xmm2,%xmm0
- .byte 15,40,227 // movaps %xmm3,%xmm4
- .byte 15,92,226 // subps %xmm2,%xmm4
- .byte 15,41,101,216 // movaps %xmm4,-0x28(%ebp)
- .byte 15,40,214 // movaps %xmm6,%xmm2
- .byte 15,92,211 // subps %xmm3,%xmm2
- .byte 15,89,211 // mulps %xmm3,%xmm2
- .byte 15,94,212 // divps %xmm4,%xmm2
- .byte 15,88,211 // addps %xmm3,%xmm2
- .byte 15,40,232 // movaps %xmm0,%xmm5
- .byte 15,85,234 // andnps %xmm2,%xmm5
- .byte 15,84,240 // andps %xmm0,%xmm6
- .byte 15,86,245 // orps %xmm5,%xmm6
- .byte 15,40,109,184 // movaps -0x48(%ebp),%xmm5
- .byte 15,40,213 // movaps %xmm5,%xmm2
- .byte 15,40,101,88 // movaps 0x58(%ebp),%xmm4
- .byte 15,89,212 // mulps %xmm4,%xmm2
- .byte 15,40,101,168 // movaps -0x58(%ebp),%xmm4
+ .byte 15,194,196,2 // cmpleps %xmm4,%xmm0
+ .byte 15,40,221 // movaps %xmm5,%xmm3
+ .byte 15,92,220 // subps %xmm4,%xmm3
+ .byte 15,41,93,232 // movaps %xmm3,-0x18(%ebp)
+ .byte 15,40,226 // movaps %xmm2,%xmm4
.byte 15,92,229 // subps %xmm5,%xmm4
- .byte 15,41,101,168 // movaps %xmm4,-0x58(%ebp)
- .byte 15,88,109,88 // addps 0x58(%ebp),%xmm5
- .byte 15,92,234 // subps %xmm2,%xmm5
- .byte 15,41,109,184 // movaps %xmm5,-0x48(%ebp)
- .byte 15,40,234 // movaps %xmm2,%xmm5
- .byte 15,194,215,1 // cmpltps %xmm7,%xmm2
+ .byte 15,89,229 // mulps %xmm5,%xmm4
+ .byte 15,94,227 // divps %xmm3,%xmm4
+ .byte 15,88,229 // addps %xmm5,%xmm4
+ .byte 15,40,216 // movaps %xmm0,%xmm3
+ .byte 15,85,220 // andnps %xmm4,%xmm3
.byte 15,40,226 // movaps %xmm2,%xmm4
- .byte 15,85,230 // andnps %xmm6,%xmm4
- .byte 15,92,243 // subps %xmm3,%xmm6
- .byte 15,92,235 // subps %xmm3,%xmm5
- .byte 15,41,109,152 // movaps %xmm5,-0x68(%ebp)
- .byte 15,89,245 // mulps %xmm5,%xmm6
- .byte 15,92,251 // subps %xmm3,%xmm7
- .byte 15,94,247 // divps %xmm7,%xmm6
- .byte 15,88,243 // addps %xmm3,%xmm6
- .byte 15,84,242 // andps %xmm2,%xmm6
- .byte 15,86,244 // orps %xmm4,%xmm6
- .byte 15,40,101,200 // movaps -0x38(%ebp),%xmm4
- .byte 15,92,227 // subps %xmm3,%xmm4
- .byte 15,89,227 // mulps %xmm3,%xmm4
- .byte 15,94,101,216 // divps -0x28(%ebp),%xmm4
- .byte 15,88,227 // addps %xmm3,%xmm4
- .byte 15,40,232 // movaps %xmm0,%xmm5
- .byte 15,85,236 // andnps %xmm4,%xmm5
- .byte 15,40,101,200 // movaps -0x38(%ebp),%xmm4
.byte 15,84,224 // andps %xmm0,%xmm4
- .byte 15,86,229 // orps %xmm5,%xmm4
- .byte 15,40,234 // movaps %xmm2,%xmm5
- .byte 15,85,236 // andnps %xmm4,%xmm5
- .byte 15,92,227 // subps %xmm3,%xmm4
- .byte 15,89,101,152 // mulps -0x68(%ebp),%xmm4
+ .byte 15,86,227 // orps %xmm3,%xmm4
+ .byte 15,40,85,216 // movaps -0x28(%ebp),%xmm2
+ .byte 15,40,93,184 // movaps -0x48(%ebp),%xmm3
+ .byte 15,89,211 // mulps %xmm3,%xmm2
+ .byte 15,88,93,216 // addps -0x28(%ebp),%xmm3
+ .byte 15,92,218 // subps %xmm2,%xmm3
+ .byte 15,41,93,184 // movaps %xmm3,-0x48(%ebp)
+ .byte 15,41,85,216 // movaps %xmm2,-0x28(%ebp)
+ .byte 15,194,215,1 // cmpltps %xmm7,%xmm2
+ .byte 15,40,218 // movaps %xmm2,%xmm3
+ .byte 15,85,220 // andnps %xmm4,%xmm3
+ .byte 15,41,93,200 // movaps %xmm3,-0x38(%ebp)
+ .byte 15,92,229 // subps %xmm5,%xmm4
+ .byte 15,40,93,216 // movaps -0x28(%ebp),%xmm3
+ .byte 15,92,221 // subps %xmm5,%xmm3
+ .byte 15,41,93,216 // movaps %xmm3,-0x28(%ebp)
+ .byte 15,89,227 // mulps %xmm3,%xmm4
+ .byte 15,92,253 // subps %xmm5,%xmm7
.byte 15,94,231 // divps %xmm7,%xmm4
- .byte 15,88,227 // addps %xmm3,%xmm4
+ .byte 15,88,229 // addps %xmm5,%xmm4
.byte 15,84,226 // andps %xmm2,%xmm4
- .byte 15,86,229 // orps %xmm5,%xmm4
- .byte 15,40,236 // movaps %xmm4,%xmm5
- .byte 15,40,225 // movaps %xmm1,%xmm4
- .byte 15,92,227 // subps %xmm3,%xmm4
- .byte 15,89,227 // mulps %xmm3,%xmm4
- .byte 15,94,101,216 // divps -0x28(%ebp),%xmm4
- .byte 15,88,227 // addps %xmm3,%xmm4
+ .byte 15,86,101,200 // orps -0x38(%ebp),%xmm4
+ .byte 15,41,101,200 // movaps %xmm4,-0x38(%ebp)
+ .byte 15,40,222 // movaps %xmm6,%xmm3
+ .byte 15,92,221 // subps %xmm5,%xmm3
+ .byte 15,89,221 // mulps %xmm5,%xmm3
+ .byte 15,94,93,232 // divps -0x18(%ebp),%xmm3
+ .byte 15,88,221 // addps %xmm5,%xmm3
+ .byte 15,40,224 // movaps %xmm0,%xmm4
+ .byte 15,85,227 // andnps %xmm3,%xmm4
+ .byte 15,84,240 // andps %xmm0,%xmm6
+ .byte 15,86,244 // orps %xmm4,%xmm6
+ .byte 15,40,218 // movaps %xmm2,%xmm3
+ .byte 15,40,230 // movaps %xmm6,%xmm4
+ .byte 15,85,220 // andnps %xmm4,%xmm3
+ .byte 15,92,229 // subps %xmm5,%xmm4
+ .byte 15,40,117,216 // movaps -0x28(%ebp),%xmm6
+ .byte 15,89,230 // mulps %xmm6,%xmm4
+ .byte 15,94,231 // divps %xmm7,%xmm4
+ .byte 15,88,229 // addps %xmm5,%xmm4
+ .byte 15,84,226 // andps %xmm2,%xmm4
+ .byte 15,86,227 // orps %xmm3,%xmm4
+ .byte 15,40,217 // movaps %xmm1,%xmm3
+ .byte 15,92,221 // subps %xmm5,%xmm3
+ .byte 15,89,221 // mulps %xmm5,%xmm3
+ .byte 15,94,93,232 // divps -0x18(%ebp),%xmm3
+ .byte 15,88,221 // addps %xmm5,%xmm3
.byte 15,84,200 // andps %xmm0,%xmm1
- .byte 15,85,196 // andnps %xmm4,%xmm0
+ .byte 15,85,195 // andnps %xmm3,%xmm0
.byte 15,86,193 // orps %xmm1,%xmm0
.byte 15,40,202 // movaps %xmm2,%xmm1
.byte 15,85,200 // andnps %xmm0,%xmm1
- .byte 15,92,195 // subps %xmm3,%xmm0
- .byte 15,89,69,152 // mulps -0x68(%ebp),%xmm0
+ .byte 15,92,197 // subps %xmm5,%xmm0
+ .byte 15,89,198 // mulps %xmm6,%xmm0
.byte 15,94,199 // divps %xmm7,%xmm0
- .byte 15,88,195 // addps %xmm3,%xmm0
+ .byte 15,88,197 // addps %xmm5,%xmm0
.byte 15,84,194 // andps %xmm2,%xmm0
.byte 15,86,193 // orps %xmm1,%xmm0
.byte 15,87,201 // xorps %xmm1,%xmm1
- .byte 15,95,241 // maxps %xmm1,%xmm6
- .byte 15,95,233 // maxps %xmm1,%xmm5
- .byte 15,40,221 // movaps %xmm5,%xmm3
+ .byte 15,40,85,200 // movaps -0x38(%ebp),%xmm2
+ .byte 15,95,209 // maxps %xmm1,%xmm2
+ .byte 15,95,225 // maxps %xmm1,%xmm4
.byte 15,95,193 // maxps %xmm1,%xmm0
- .byte 15,40,125,168 // movaps -0x58(%ebp),%xmm7
- .byte 15,40,207 // movaps %xmm7,%xmm1
- .byte 15,40,109,40 // movaps 0x28(%ebp),%xmm5
- .byte 15,89,205 // mulps %xmm5,%xmm1
- .byte 15,40,173,104,255,255,255 // movaps -0x98(%ebp),%xmm5
- .byte 15,88,233 // addps %xmm1,%xmm5
- .byte 15,88,238 // addps %xmm6,%xmm5
- .byte 15,40,207 // movaps %xmm7,%xmm1
- .byte 15,40,101,56 // movaps 0x38(%ebp),%xmm4
- .byte 15,89,204 // mulps %xmm4,%xmm1
- .byte 15,40,149,120,255,255,255 // movaps -0x88(%ebp),%xmm2
- .byte 15,88,209 // addps %xmm1,%xmm2
- .byte 15,88,211 // addps %xmm3,%xmm2
- .byte 15,40,202 // movaps %xmm2,%xmm1
- .byte 15,40,85,72 // movaps 0x48(%ebp),%xmm2
- .byte 15,40,242 // movaps %xmm2,%xmm6
- .byte 15,89,254 // mulps %xmm6,%xmm7
- .byte 15,88,125,136 // addps -0x78(%ebp),%xmm7
- .byte 15,88,248 // addps %xmm0,%xmm7
- .byte 15,40,215 // movaps %xmm7,%xmm2
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
- .byte 139,85,20 // mov 0x14(%ebp),%edx
- .byte 139,117,24 // mov 0x18(%ebp),%esi
- .byte 139,125,12 // mov 0xc(%ebp),%edi
- .byte 141,95,4 // lea 0x4(%edi),%ebx
- .byte 15,40,69,88 // movaps 0x58(%ebp),%xmm0
- .byte 15,41,68,36,80 // movaps %xmm0,0x50(%esp)
- .byte 15,41,116,36,64 // movaps %xmm6,0x40(%esp)
- .byte 15,41,100,36,48 // movaps %xmm4,0x30(%esp)
- .byte 15,40,69,40 // movaps 0x28(%ebp),%xmm0
- .byte 15,41,68,36,32 // movaps %xmm0,0x20(%esp)
- .byte 137,116,36,16 // mov %esi,0x10(%esp)
- .byte 137,84,36,12 // mov %edx,0xc(%esp)
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
- .byte 15,40,197 // movaps %xmm5,%xmm0
+ .byte 15,40,157,72,255,255,255 // movaps -0xb8(%ebp),%xmm3
+ .byte 15,88,93,152 // addps -0x68(%ebp),%xmm3
+ .byte 15,88,218 // addps %xmm2,%xmm3
+ .byte 15,40,141,104,255,255,255 // movaps -0x98(%ebp),%xmm1
+ .byte 15,88,77,136 // addps -0x78(%ebp),%xmm1
+ .byte 15,88,204 // addps %xmm4,%xmm1
+ .byte 15,40,85,168 // movaps -0x58(%ebp),%xmm2
+ .byte 15,88,149,88,255,255,255 // addps -0xa8(%ebp),%xmm2
+ .byte 15,88,208 // addps %xmm0,%xmm2
+ .byte 139,77,12 // mov 0xc(%ebp),%ecx
+ .byte 141,81,4 // lea 0x4(%ecx),%edx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 15,40,195 // movaps %xmm3,%xmm0
.byte 15,40,93,184 // movaps -0x48(%ebp),%xmm3
- .byte 255,23 // call *(%edi)
- .byte 129,196,236,0,0,0 // add $0xec,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 82 // push %edx
+ .byte 80 // push %eax
+ .byte 255,17 // call *(%ecx)
+ .byte 129,196,200,0,0,0 // add $0xc8,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -51044,225 +50485,216 @@ FUNCTION(_sk_saturation_sse2)
_sk_saturation_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 129,236,12,1,0,0 // sub $0x10c,%esp
- .byte 15,41,149,72,255,255,255 // movaps %xmm2,-0xb8(%ebp)
- .byte 15,41,141,88,255,255,255 // movaps %xmm1,-0xa8(%ebp)
- .byte 15,41,133,104,255,255,255 // movaps %xmm0,-0x98(%ebp)
+ .byte 129,236,216,0,0,0 // sub $0xd8,%esp
+ .byte 15,41,149,40,255,255,255 // movaps %xmm2,-0xd8(%ebp)
+ .byte 15,41,141,56,255,255,255 // movaps %xmm1,-0xc8(%ebp)
+ .byte 15,41,133,72,255,255,255 // movaps %xmm0,-0xb8(%ebp)
+ .byte 139,69,8 // mov 0x8(%ebp),%eax
+ .byte 15,40,112,16 // movaps 0x10(%eax),%xmm6
+ .byte 15,41,117,184 // movaps %xmm6,-0x48(%ebp)
.byte 15,40,225 // movaps %xmm1,%xmm4
.byte 15,95,226 // maxps %xmm2,%xmm4
- .byte 15,40,240 // movaps %xmm0,%xmm6
- .byte 15,95,244 // maxps %xmm4,%xmm6
+ .byte 15,40,232 // movaps %xmm0,%xmm5
+ .byte 15,95,236 // maxps %xmm4,%xmm5
.byte 15,40,225 // movaps %xmm1,%xmm4
.byte 15,93,226 // minps %xmm2,%xmm4
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 15,93,212 // minps %xmm4,%xmm2
- .byte 15,40,77,40 // movaps 0x28(%ebp),%xmm1
- .byte 15,92,242 // subps %xmm2,%xmm6
- .byte 15,40,195 // movaps %xmm3,%xmm0
- .byte 15,41,69,216 // movaps %xmm0,-0x28(%ebp)
- .byte 15,40,232 // movaps %xmm0,%xmm5
- .byte 15,89,233 // mulps %xmm1,%xmm5
- .byte 15,89,93,56 // mulps 0x38(%ebp),%xmm3
- .byte 15,40,248 // movaps %xmm0,%xmm7
- .byte 15,89,125,72 // mulps 0x48(%ebp),%xmm7
- .byte 15,40,195 // movaps %xmm3,%xmm0
- .byte 15,93,199 // minps %xmm7,%xmm0
- .byte 15,40,213 // movaps %xmm5,%xmm2
- .byte 15,93,208 // minps %xmm0,%xmm2
- .byte 15,40,227 // movaps %xmm3,%xmm4
- .byte 15,95,231 // maxps %xmm7,%xmm4
- .byte 15,40,197 // movaps %xmm5,%xmm0
- .byte 15,95,196 // maxps %xmm4,%xmm0
- .byte 15,92,194 // subps %xmm2,%xmm0
+ .byte 15,40,64,32 // movaps 0x20(%eax),%xmm0
.byte 15,92,234 // subps %xmm2,%xmm5
+ .byte 15,40,214 // movaps %xmm6,%xmm2
+ .byte 15,41,93,216 // movaps %xmm3,-0x28(%ebp)
+ .byte 15,89,211 // mulps %xmm3,%xmm2
+ .byte 15,40,224 // movaps %xmm0,%xmm4
+ .byte 15,40,240 // movaps %xmm0,%xmm6
+ .byte 15,89,227 // mulps %xmm3,%xmm4
+ .byte 15,40,120,48 // movaps 0x30(%eax),%xmm7
+ .byte 15,41,125,200 // movaps %xmm7,-0x38(%ebp)
+ .byte 15,89,251 // mulps %xmm3,%xmm7
+ .byte 15,40,204 // movaps %xmm4,%xmm1
+ .byte 15,93,207 // minps %xmm7,%xmm1
+ .byte 15,40,194 // movaps %xmm2,%xmm0
+ .byte 15,93,209 // minps %xmm1,%xmm2
+ .byte 15,40,204 // movaps %xmm4,%xmm1
+ .byte 15,40,220 // movaps %xmm4,%xmm3
+ .byte 15,95,207 // maxps %xmm7,%xmm1
+ .byte 15,40,224 // movaps %xmm0,%xmm4
+ .byte 15,95,225 // maxps %xmm1,%xmm4
+ .byte 15,92,226 // subps %xmm2,%xmm4
+ .byte 15,92,194 // subps %xmm2,%xmm0
+ .byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,92,218 // subps %xmm2,%xmm3
.byte 15,92,250 // subps %xmm2,%xmm7
- .byte 15,89,117,88 // mulps 0x58(%ebp),%xmm6
- .byte 15,89,238 // mulps %xmm6,%xmm5
- .byte 15,89,222 // mulps %xmm6,%xmm3
- .byte 15,89,254 // mulps %xmm6,%xmm7
- .byte 232,0,0,0,0 // call 1c53 <_sk_saturation_sse2+0x8e>
- .byte 88 // pop %eax
- .byte 15,40,176,29,119,0,0 // movaps 0x771d(%eax),%xmm6
- .byte 15,40,209 // movaps %xmm1,%xmm2
- .byte 15,89,214 // mulps %xmm6,%xmm2
- .byte 15,40,160,45,119,0,0 // movaps 0x772d(%eax),%xmm4
- .byte 15,40,77,56 // movaps 0x38(%ebp),%xmm1
- .byte 15,89,204 // mulps %xmm4,%xmm1
- .byte 15,88,202 // addps %xmm2,%xmm1
- .byte 15,40,85,72 // movaps 0x48(%ebp),%xmm2
- .byte 15,89,144,61,119,0,0 // mulps 0x773d(%eax),%xmm2
- .byte 15,88,209 // addps %xmm1,%xmm2
- .byte 15,94,232 // divps %xmm0,%xmm5
- .byte 15,94,216 // divps %xmm0,%xmm3
- .byte 15,94,248 // divps %xmm0,%xmm7
- .byte 15,87,201 // xorps %xmm1,%xmm1
- .byte 15,194,193,4 // cmpneqps %xmm1,%xmm0
- .byte 15,84,232 // andps %xmm0,%xmm5
- .byte 15,84,216 // andps %xmm0,%xmm3
- .byte 15,84,199 // andps %xmm7,%xmm0
- .byte 15,40,205 // movaps %xmm5,%xmm1
- .byte 15,89,206 // mulps %xmm6,%xmm1
- .byte 15,40,251 // movaps %xmm3,%xmm7
- .byte 15,89,252 // mulps %xmm4,%xmm7
- .byte 15,88,249 // addps %xmm1,%xmm7
+ .byte 15,40,64,64 // movaps 0x40(%eax),%xmm0
+ .byte 15,41,69,152 // movaps %xmm0,-0x68(%ebp)
+ .byte 15,89,232 // mulps %xmm0,%xmm5
+ .byte 15,89,205 // mulps %xmm5,%xmm1
+ .byte 15,41,77,168 // movaps %xmm1,-0x58(%ebp)
+ .byte 15,89,221 // mulps %xmm5,%xmm3
+ .byte 15,40,211 // movaps %xmm3,%xmm2
+ .byte 15,89,253 // mulps %xmm5,%xmm7
+ .byte 232,0,0,0,0 // call 1545 <_sk_saturation_sse2+0xb0>
+ .byte 89 // pop %ecx
+ .byte 15,40,153,59,91,0,0 // movaps 0x5b3b(%ecx),%xmm3
+ .byte 15,41,157,88,255,255,255 // movaps %xmm3,-0xa8(%ebp)
+ .byte 15,40,77,184 // movaps -0x48(%ebp),%xmm1
+ .byte 15,40,193 // movaps %xmm1,%xmm0
+ .byte 15,89,195 // mulps %xmm3,%xmm0
+ .byte 15,40,153,75,91,0,0 // movaps 0x5b4b(%ecx),%xmm3
+ .byte 15,41,93,232 // movaps %xmm3,-0x18(%ebp)
+ .byte 15,40,238 // movaps %xmm6,%xmm5
+ .byte 15,89,235 // mulps %xmm3,%xmm5
+ .byte 15,88,232 // addps %xmm0,%xmm5
+ .byte 15,40,129,107,91,0,0 // movaps 0x5b6b(%ecx),%xmm0
+ .byte 15,41,133,104,255,255,255 // movaps %xmm0,-0x98(%ebp)
+ .byte 15,92,69,216 // subps -0x28(%ebp),%xmm0
+ .byte 15,89,200 // mulps %xmm0,%xmm1
+ .byte 15,41,77,184 // movaps %xmm1,-0x48(%ebp)
.byte 15,40,200 // movaps %xmm0,%xmm1
- .byte 15,89,136,61,119,0,0 // mulps 0x773d(%eax),%xmm1
- .byte 15,88,207 // addps %xmm7,%xmm1
- .byte 15,89,85,216 // mulps -0x28(%ebp),%xmm2
- .byte 15,92,209 // subps %xmm1,%xmm2
- .byte 15,88,234 // addps %xmm2,%xmm5
- .byte 15,88,218 // addps %xmm2,%xmm3
- .byte 15,88,208 // addps %xmm0,%xmm2
- .byte 15,40,195 // movaps %xmm3,%xmm0
- .byte 15,93,194 // minps %xmm2,%xmm0
- .byte 15,40,205 // movaps %xmm5,%xmm1
- .byte 15,93,200 // minps %xmm0,%xmm1
- .byte 15,40,195 // movaps %xmm3,%xmm0
- .byte 15,95,194 // maxps %xmm2,%xmm0
- .byte 15,41,149,120,255,255,255 // movaps %xmm2,-0x88(%ebp)
- .byte 15,40,253 // movaps %xmm5,%xmm7
- .byte 15,95,248 // maxps %xmm0,%xmm7
- .byte 15,41,125,200 // movaps %xmm7,-0x38(%ebp)
- .byte 15,89,245 // mulps %xmm5,%xmm6
- .byte 15,89,227 // mulps %xmm3,%xmm4
- .byte 15,88,230 // addps %xmm6,%xmm4
- .byte 15,40,128,61,119,0,0 // movaps 0x773d(%eax),%xmm0
- .byte 15,89,194 // mulps %xmm2,%xmm0
- .byte 15,88,196 // addps %xmm4,%xmm0
- .byte 15,41,69,136 // movaps %xmm0,-0x78(%ebp)
- .byte 15,87,255 // xorps %xmm7,%xmm7
- .byte 15,194,249,2 // cmpleps %xmm1,%xmm7
- .byte 15,40,208 // movaps %xmm0,%xmm2
- .byte 15,92,209 // subps %xmm1,%xmm2
- .byte 15,41,85,184 // movaps %xmm2,-0x48(%ebp)
- .byte 15,40,205 // movaps %xmm5,%xmm1
- .byte 15,92,200 // subps %xmm0,%xmm1
+ .byte 15,89,241 // mulps %xmm1,%xmm6
+ .byte 15,41,117,136 // movaps %xmm6,-0x78(%ebp)
+ .byte 15,40,69,200 // movaps -0x38(%ebp),%xmm0
.byte 15,89,200 // mulps %xmm0,%xmm1
- .byte 15,94,202 // divps %xmm2,%xmm1
- .byte 15,88,200 // addps %xmm0,%xmm1
- .byte 15,40,199 // movaps %xmm7,%xmm0
- .byte 15,85,193 // andnps %xmm1,%xmm0
- .byte 15,84,239 // andps %xmm7,%xmm5
- .byte 15,86,232 // orps %xmm0,%xmm5
- .byte 15,40,69,216 // movaps -0x28(%ebp),%xmm0
+ .byte 15,41,141,120,255,255,255 // movaps %xmm1,-0x88(%ebp)
.byte 15,40,200 // movaps %xmm0,%xmm1
- .byte 15,40,224 // movaps %xmm0,%xmm4
- .byte 15,40,69,88 // movaps 0x58(%ebp),%xmm0
+ .byte 15,40,129,91,91,0,0 // movaps 0x5b5b(%ecx),%xmm0
.byte 15,89,200 // mulps %xmm0,%xmm1
- .byte 15,40,144,77,119,0,0 // movaps 0x774d(%eax),%xmm2
- .byte 15,41,85,152 // movaps %xmm2,-0x68(%ebp)
- .byte 15,92,212 // subps %xmm4,%xmm2
- .byte 15,41,85,168 // movaps %xmm2,-0x58(%ebp)
- .byte 15,88,224 // addps %xmm0,%xmm4
- .byte 15,92,225 // subps %xmm1,%xmm4
+ .byte 15,88,205 // addps %xmm5,%xmm1
+ .byte 15,40,109,168 // movaps -0x58(%ebp),%xmm5
+ .byte 15,94,236 // divps %xmm4,%xmm5
+ .byte 15,94,212 // divps %xmm4,%xmm2
+ .byte 15,94,252 // divps %xmm4,%xmm7
+ .byte 15,87,219 // xorps %xmm3,%xmm3
+ .byte 15,194,227,4 // cmpneqps %xmm3,%xmm4
+ .byte 15,84,236 // andps %xmm4,%xmm5
+ .byte 15,84,212 // andps %xmm4,%xmm2
+ .byte 15,84,231 // andps %xmm7,%xmm4
+ .byte 15,40,220 // movaps %xmm4,%xmm3
+ .byte 15,40,245 // movaps %xmm5,%xmm6
+ .byte 15,40,165,88,255,255,255 // movaps -0xa8(%ebp),%xmm4
+ .byte 15,89,244 // mulps %xmm4,%xmm6
+ .byte 15,40,250 // movaps %xmm2,%xmm7
+ .byte 15,89,125,232 // mulps -0x18(%ebp),%xmm7
+ .byte 15,88,254 // addps %xmm6,%xmm7
+ .byte 15,40,243 // movaps %xmm3,%xmm6
+ .byte 15,89,240 // mulps %xmm0,%xmm6
+ .byte 15,88,247 // addps %xmm7,%xmm6
+ .byte 15,89,77,216 // mulps -0x28(%ebp),%xmm1
+ .byte 15,92,206 // subps %xmm6,%xmm1
+ .byte 15,88,233 // addps %xmm1,%xmm5
+ .byte 15,88,209 // addps %xmm1,%xmm2
+ .byte 15,41,85,200 // movaps %xmm2,-0x38(%ebp)
+ .byte 15,88,203 // addps %xmm3,%xmm1
+ .byte 15,40,218 // movaps %xmm2,%xmm3
+ .byte 15,93,217 // minps %xmm1,%xmm3
+ .byte 15,40,253 // movaps %xmm5,%xmm7
+ .byte 15,93,251 // minps %xmm3,%xmm7
+ .byte 15,40,218 // movaps %xmm2,%xmm3
+ .byte 15,95,217 // maxps %xmm1,%xmm3
+ .byte 15,40,245 // movaps %xmm5,%xmm6
+ .byte 15,95,243 // maxps %xmm3,%xmm6
+ .byte 15,89,229 // mulps %xmm5,%xmm4
+ .byte 15,40,93,232 // movaps -0x18(%ebp),%xmm3
+ .byte 15,89,218 // mulps %xmm2,%xmm3
+ .byte 15,88,220 // addps %xmm4,%xmm3
+ .byte 15,89,193 // mulps %xmm1,%xmm0
+ .byte 15,88,195 // addps %xmm3,%xmm0
+ .byte 15,87,219 // xorps %xmm3,%xmm3
+ .byte 15,194,223,2 // cmpleps %xmm7,%xmm3
+ .byte 15,40,208 // movaps %xmm0,%xmm2
+ .byte 15,92,215 // subps %xmm7,%xmm2
+ .byte 15,41,85,232 // movaps %xmm2,-0x18(%ebp)
+ .byte 15,40,253 // movaps %xmm5,%xmm7
+ .byte 15,92,248 // subps %xmm0,%xmm7
+ .byte 15,89,248 // mulps %xmm0,%xmm7
+ .byte 15,94,250 // divps %xmm2,%xmm7
+ .byte 15,88,248 // addps %xmm0,%xmm7
+ .byte 15,40,211 // movaps %xmm3,%xmm2
+ .byte 15,85,215 // andnps %xmm7,%xmm2
+ .byte 15,84,235 // andps %xmm3,%xmm5
+ .byte 15,86,234 // orps %xmm2,%xmm5
+ .byte 15,40,125,152 // movaps -0x68(%ebp),%xmm7
+ .byte 15,40,215 // movaps %xmm7,%xmm2
+ .byte 15,40,101,216 // movaps -0x28(%ebp),%xmm4
+ .byte 15,89,212 // mulps %xmm4,%xmm2
+ .byte 15,88,231 // addps %xmm7,%xmm4
+ .byte 15,92,226 // subps %xmm2,%xmm4
.byte 15,41,101,216 // movaps %xmm4,-0x28(%ebp)
- .byte 15,40,241 // movaps %xmm1,%xmm6
- .byte 15,40,209 // movaps %xmm1,%xmm2
- .byte 15,40,77,200 // movaps -0x38(%ebp),%xmm1
- .byte 15,194,209,1 // cmpltps %xmm1,%xmm2
+ .byte 15,40,250 // movaps %xmm2,%xmm7
+ .byte 15,194,214,1 // cmpltps %xmm6,%xmm2
.byte 15,40,226 // movaps %xmm2,%xmm4
.byte 15,85,229 // andnps %xmm5,%xmm4
- .byte 15,40,69,136 // movaps -0x78(%ebp),%xmm0
.byte 15,92,232 // subps %xmm0,%xmm5
+ .byte 15,92,248 // subps %xmm0,%xmm7
+ .byte 15,89,239 // mulps %xmm7,%xmm5
.byte 15,92,240 // subps %xmm0,%xmm6
- .byte 15,89,238 // mulps %xmm6,%xmm5
- .byte 15,92,200 // subps %xmm0,%xmm1
- .byte 15,41,77,200 // movaps %xmm1,-0x38(%ebp)
- .byte 15,94,233 // divps %xmm1,%xmm5
+ .byte 15,94,238 // divps %xmm6,%xmm5
.byte 15,88,232 // addps %xmm0,%xmm5
.byte 15,84,234 // andps %xmm2,%xmm5
.byte 15,86,236 // orps %xmm4,%xmm5
- .byte 15,40,203 // movaps %xmm3,%xmm1
- .byte 15,92,200 // subps %xmm0,%xmm1
- .byte 15,89,200 // mulps %xmm0,%xmm1
- .byte 15,94,77,184 // divps -0x48(%ebp),%xmm1
- .byte 15,88,200 // addps %xmm0,%xmm1
- .byte 15,40,231 // movaps %xmm7,%xmm4
- .byte 15,85,225 // andnps %xmm1,%xmm4
- .byte 15,84,223 // andps %xmm7,%xmm3
- .byte 15,86,220 // orps %xmm4,%xmm3
+ .byte 15,41,109,168 // movaps %xmm5,-0x58(%ebp)
+ .byte 15,40,101,200 // movaps -0x38(%ebp),%xmm4
+ .byte 15,92,224 // subps %xmm0,%xmm4
+ .byte 15,89,224 // mulps %xmm0,%xmm4
+ .byte 15,94,101,232 // divps -0x18(%ebp),%xmm4
+ .byte 15,88,224 // addps %xmm0,%xmm4
+ .byte 15,40,235 // movaps %xmm3,%xmm5
+ .byte 15,85,236 // andnps %xmm4,%xmm5
+ .byte 15,40,101,200 // movaps -0x38(%ebp),%xmm4
+ .byte 15,84,227 // andps %xmm3,%xmm4
+ .byte 15,86,229 // orps %xmm5,%xmm4
+ .byte 15,40,234 // movaps %xmm2,%xmm5
+ .byte 15,85,236 // andnps %xmm4,%xmm5
+ .byte 15,92,224 // subps %xmm0,%xmm4
+ .byte 15,89,231 // mulps %xmm7,%xmm4
+ .byte 15,94,230 // divps %xmm6,%xmm4
+ .byte 15,88,224 // addps %xmm0,%xmm4
+ .byte 15,84,226 // andps %xmm2,%xmm4
+ .byte 15,86,229 // orps %xmm5,%xmm4
+ .byte 15,40,236 // movaps %xmm4,%xmm5
+ .byte 15,40,225 // movaps %xmm1,%xmm4
+ .byte 15,92,224 // subps %xmm0,%xmm4
+ .byte 15,89,224 // mulps %xmm0,%xmm4
+ .byte 15,94,101,232 // divps -0x18(%ebp),%xmm4
+ .byte 15,88,224 // addps %xmm0,%xmm4
+ .byte 15,84,203 // andps %xmm3,%xmm1
+ .byte 15,85,220 // andnps %xmm4,%xmm3
+ .byte 15,86,217 // orps %xmm1,%xmm3
.byte 15,40,202 // movaps %xmm2,%xmm1
.byte 15,85,203 // andnps %xmm3,%xmm1
.byte 15,92,216 // subps %xmm0,%xmm3
- .byte 15,89,222 // mulps %xmm6,%xmm3
- .byte 15,94,93,200 // divps -0x38(%ebp),%xmm3
+ .byte 15,89,223 // mulps %xmm7,%xmm3
+ .byte 15,94,222 // divps %xmm6,%xmm3
.byte 15,88,216 // addps %xmm0,%xmm3
.byte 15,84,218 // andps %xmm2,%xmm3
.byte 15,86,217 // orps %xmm1,%xmm3
- .byte 15,40,165,120,255,255,255 // movaps -0x88(%ebp),%xmm4
- .byte 15,40,204 // movaps %xmm4,%xmm1
- .byte 15,92,200 // subps %xmm0,%xmm1
- .byte 15,89,200 // mulps %xmm0,%xmm1
- .byte 15,94,77,184 // divps -0x48(%ebp),%xmm1
- .byte 15,88,200 // addps %xmm0,%xmm1
- .byte 15,84,231 // andps %xmm7,%xmm4
- .byte 15,85,249 // andnps %xmm1,%xmm7
- .byte 15,86,252 // orps %xmm4,%xmm7
- .byte 15,40,202 // movaps %xmm2,%xmm1
- .byte 15,85,207 // andnps %xmm7,%xmm1
- .byte 15,92,248 // subps %xmm0,%xmm7
- .byte 15,89,254 // mulps %xmm6,%xmm7
- .byte 15,94,125,200 // divps -0x38(%ebp),%xmm7
- .byte 15,88,248 // addps %xmm0,%xmm7
- .byte 15,84,250 // andps %xmm2,%xmm7
- .byte 15,86,249 // orps %xmm1,%xmm7
.byte 15,87,192 // xorps %xmm0,%xmm0
+ .byte 15,40,77,168 // movaps -0x58(%ebp),%xmm1
+ .byte 15,95,200 // maxps %xmm0,%xmm1
.byte 15,95,232 // maxps %xmm0,%xmm5
.byte 15,95,216 // maxps %xmm0,%xmm3
- .byte 15,95,248 // maxps %xmm0,%xmm7
- .byte 15,40,69,88 // movaps 0x58(%ebp),%xmm0
- .byte 15,40,101,152 // movaps -0x68(%ebp),%xmm4
- .byte 15,92,224 // subps %xmm0,%xmm4
- .byte 15,40,141,104,255,255,255 // movaps -0x98(%ebp),%xmm1
+ .byte 15,40,165,104,255,255,255 // movaps -0x98(%ebp),%xmm4
+ .byte 15,92,101,152 // subps -0x68(%ebp),%xmm4
+ .byte 15,40,133,72,255,255,255 // movaps -0xb8(%ebp),%xmm0
+ .byte 15,89,196 // mulps %xmm4,%xmm0
+ .byte 15,88,69,184 // addps -0x48(%ebp),%xmm0
+ .byte 15,88,193 // addps %xmm1,%xmm0
+ .byte 15,40,141,56,255,255,255 // movaps -0xc8(%ebp),%xmm1
.byte 15,89,204 // mulps %xmm4,%xmm1
- .byte 15,40,85,168 // movaps -0x58(%ebp),%xmm2
- .byte 15,40,194 // movaps %xmm2,%xmm0
- .byte 15,40,117,40 // movaps 0x28(%ebp),%xmm6
- .byte 15,89,198 // mulps %xmm6,%xmm0
- .byte 15,88,200 // addps %xmm0,%xmm1
+ .byte 15,88,77,136 // addps -0x78(%ebp),%xmm1
.byte 15,88,205 // addps %xmm5,%xmm1
- .byte 15,40,241 // movaps %xmm1,%xmm6
- .byte 15,40,141,88,255,255,255 // movaps -0xa8(%ebp),%xmm1
- .byte 15,89,204 // mulps %xmm4,%xmm1
- .byte 15,40,196 // movaps %xmm4,%xmm0
- .byte 15,40,226 // movaps %xmm2,%xmm4
- .byte 15,40,109,56 // movaps 0x38(%ebp),%xmm5
- .byte 15,89,229 // mulps %xmm5,%xmm4
- .byte 15,88,204 // addps %xmm4,%xmm1
- .byte 15,88,203 // addps %xmm3,%xmm1
- .byte 15,89,133,72,255,255,255 // mulps -0xb8(%ebp),%xmm0
- .byte 15,40,93,72 // movaps 0x48(%ebp),%xmm3
- .byte 15,89,211 // mulps %xmm3,%xmm2
- .byte 15,88,208 // addps %xmm0,%xmm2
- .byte 15,88,215 // addps %xmm7,%xmm2
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
- .byte 139,85,20 // mov 0x14(%ebp),%edx
- .byte 139,117,24 // mov 0x18(%ebp),%esi
- .byte 139,125,12 // mov 0xc(%ebp),%edi
- .byte 141,95,4 // lea 0x4(%edi),%ebx
- .byte 15,40,69,88 // movaps 0x58(%ebp),%xmm0
- .byte 15,41,68,36,80 // movaps %xmm0,0x50(%esp)
- .byte 15,41,92,36,64 // movaps %xmm3,0x40(%esp)
- .byte 15,41,108,36,48 // movaps %xmm5,0x30(%esp)
- .byte 15,40,69,40 // movaps 0x28(%ebp),%xmm0
- .byte 15,41,68,36,32 // movaps %xmm0,0x20(%esp)
- .byte 137,116,36,16 // mov %esi,0x10(%esp)
- .byte 137,84,36,12 // mov %edx,0xc(%esp)
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
- .byte 15,40,198 // movaps %xmm6,%xmm0
+ .byte 15,89,165,40,255,255,255 // mulps -0xd8(%ebp),%xmm4
+ .byte 15,40,149,120,255,255,255 // movaps -0x88(%ebp),%xmm2
+ .byte 15,88,212 // addps %xmm4,%xmm2
+ .byte 15,88,211 // addps %xmm3,%xmm2
+ .byte 139,77,12 // mov 0xc(%ebp),%ecx
+ .byte 141,81,4 // lea 0x4(%ecx),%edx
+ .byte 131,236,8 // sub $0x8,%esp
.byte 15,40,93,216 // movaps -0x28(%ebp),%xmm3
- .byte 255,23 // call *(%edi)
- .byte 129,196,12,1,0,0 // add $0x10c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 82 // push %edx
+ .byte 80 // push %eax
+ .byte 255,17 // call *(%ecx)
+ .byte 129,196,232,0,0,0 // add $0xe8,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -51272,203 +50704,182 @@ FUNCTION(_sk_color_sse2)
_sk_color_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 129,236,28,1,0,0 // sub $0x11c,%esp
+ .byte 129,236,200,0,0,0 // sub $0xc8,%esp
.byte 15,41,93,200 // movaps %xmm3,-0x38(%ebp)
- .byte 15,41,149,72,255,255,255 // movaps %xmm2,-0xb8(%ebp)
- .byte 15,40,233 // movaps %xmm1,%xmm5
- .byte 232,0,0,0,0 // call 1eda <_sk_color_sse2+0x1f>
- .byte 88 // pop %eax
- .byte 15,40,85,56 // movaps 0x38(%ebp),%xmm2
- .byte 15,40,101,40 // movaps 0x28(%ebp),%xmm4
- .byte 15,40,152,214,116,0,0 // movaps 0x74d6(%eax),%xmm3
- .byte 15,89,227 // mulps %xmm3,%xmm4
- .byte 15,41,93,216 // movaps %xmm3,-0x28(%ebp)
- .byte 15,40,176,230,116,0,0 // movaps 0x74e6(%eax),%xmm6
- .byte 15,89,214 // mulps %xmm6,%xmm2
- .byte 15,41,117,184 // movaps %xmm6,-0x48(%ebp)
- .byte 15,88,212 // addps %xmm4,%xmm2
- .byte 15,40,101,72 // movaps 0x48(%ebp),%xmm4
- .byte 15,40,184,246,116,0,0 // movaps 0x74f6(%eax),%xmm7
- .byte 15,41,189,56,255,255,255 // movaps %xmm7,-0xc8(%ebp)
- .byte 15,89,231 // mulps %xmm7,%xmm4
- .byte 15,88,226 // addps %xmm2,%xmm4
- .byte 15,41,101,136 // movaps %xmm4,-0x78(%ebp)
- .byte 15,40,85,88 // movaps 0x58(%ebp),%xmm2
- .byte 15,40,248 // movaps %xmm0,%xmm7
- .byte 15,89,250 // mulps %xmm2,%xmm7
- .byte 15,89,202 // mulps %xmm2,%xmm1
- .byte 15,41,77,152 // movaps %xmm1,-0x68(%ebp)
- .byte 15,40,231 // movaps %xmm7,%xmm4
- .byte 15,89,227 // mulps %xmm3,%xmm4
- .byte 15,40,209 // movaps %xmm1,%xmm2
- .byte 15,89,214 // mulps %xmm6,%xmm2
- .byte 15,88,212 // addps %xmm4,%xmm2
- .byte 15,40,136,6,117,0,0 // movaps 0x7506(%eax),%xmm1
- .byte 15,41,77,168 // movaps %xmm1,-0x58(%ebp)
+ .byte 15,41,85,152 // movaps %xmm2,-0x68(%ebp)
.byte 15,40,225 // movaps %xmm1,%xmm4
- .byte 15,40,93,88 // movaps 0x58(%ebp),%xmm3
- .byte 15,92,227 // subps %xmm3,%xmm4
- .byte 15,89,196 // mulps %xmm4,%xmm0
- .byte 15,41,133,88,255,255,255 // movaps %xmm0,-0xa8(%ebp)
- .byte 15,89,236 // mulps %xmm4,%xmm5
- .byte 15,41,173,120,255,255,255 // movaps %xmm5,-0x88(%ebp)
- .byte 15,40,141,72,255,255,255 // movaps -0xb8(%ebp),%xmm1
- .byte 15,89,225 // mulps %xmm1,%xmm4
.byte 15,41,165,104,255,255,255 // movaps %xmm4,-0x98(%ebp)
- .byte 15,89,203 // mulps %xmm3,%xmm1
- .byte 15,40,193 // movaps %xmm1,%xmm0
- .byte 15,40,181,56,255,255,255 // movaps -0xc8(%ebp),%xmm6
+ .byte 15,40,232 // movaps %xmm0,%xmm5
+ .byte 15,41,173,120,255,255,255 // movaps %xmm5,-0x88(%ebp)
+ .byte 232,0,0,0,0 // call 17a0 <_sk_color_sse2+0x2a>
+ .byte 89 // pop %ecx
+ .byte 139,69,8 // mov 0x8(%ebp),%eax
+ .byte 15,40,80,16 // movaps 0x10(%eax),%xmm2
+ .byte 15,40,72,32 // movaps 0x20(%eax),%xmm1
+ .byte 15,40,177,32,89,0,0 // movaps 0x5920(%ecx),%xmm6
+ .byte 15,41,117,216 // movaps %xmm6,-0x28(%ebp)
+ .byte 15,40,194 // movaps %xmm2,%xmm0
.byte 15,89,198 // mulps %xmm6,%xmm0
- .byte 15,88,194 // addps %xmm2,%xmm0
- .byte 15,40,101,136 // movaps -0x78(%ebp),%xmm4
- .byte 15,89,101,200 // mulps -0x38(%ebp),%xmm4
- .byte 15,92,224 // subps %xmm0,%xmm4
- .byte 15,88,252 // addps %xmm4,%xmm7
- .byte 15,40,109,152 // movaps -0x68(%ebp),%xmm5
- .byte 15,88,236 // addps %xmm4,%xmm5
- .byte 15,88,225 // addps %xmm1,%xmm4
- .byte 15,40,197 // movaps %xmm5,%xmm0
- .byte 15,93,196 // minps %xmm4,%xmm0
- .byte 15,40,207 // movaps %xmm7,%xmm1
- .byte 15,93,200 // minps %xmm0,%xmm1
- .byte 15,40,197 // movaps %xmm5,%xmm0
- .byte 15,95,196 // maxps %xmm4,%xmm0
- .byte 15,41,101,136 // movaps %xmm4,-0x78(%ebp)
- .byte 15,40,223 // movaps %xmm7,%xmm3
- .byte 15,95,248 // maxps %xmm0,%xmm7
- .byte 15,40,69,216 // movaps -0x28(%ebp),%xmm0
- .byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,40,85,184 // movaps -0x48(%ebp),%xmm2
+ .byte 15,40,153,48,89,0,0 // movaps 0x5930(%ecx),%xmm3
+ .byte 15,41,93,184 // movaps %xmm3,-0x48(%ebp)
+ .byte 15,40,241 // movaps %xmm1,%xmm6
+ .byte 15,89,243 // mulps %xmm3,%xmm6
+ .byte 15,88,240 // addps %xmm0,%xmm6
+ .byte 15,40,129,80,89,0,0 // movaps 0x5950(%ecx),%xmm0
+ .byte 15,41,69,168 // movaps %xmm0,-0x58(%ebp)
+ .byte 15,92,69,200 // subps -0x38(%ebp),%xmm0
+ .byte 15,89,208 // mulps %xmm0,%xmm2
+ .byte 15,41,149,56,255,255,255 // movaps %xmm2,-0xc8(%ebp)
+ .byte 15,89,200 // mulps %xmm0,%xmm1
+ .byte 15,41,141,88,255,255,255 // movaps %xmm1,-0xa8(%ebp)
+ .byte 15,40,80,48 // movaps 0x30(%eax),%xmm2
+ .byte 15,89,194 // mulps %xmm2,%xmm0
+ .byte 15,41,133,72,255,255,255 // movaps %xmm0,-0xb8(%ebp)
+ .byte 15,40,137,64,89,0,0 // movaps 0x5940(%ecx),%xmm1
+ .byte 15,89,209 // mulps %xmm1,%xmm2
+ .byte 15,88,214 // addps %xmm6,%xmm2
+ .byte 15,40,88,64 // movaps 0x40(%eax),%xmm3
+ .byte 15,40,195 // movaps %xmm3,%xmm0
+ .byte 15,89,197 // mulps %xmm5,%xmm0
+ .byte 15,40,243 // movaps %xmm3,%xmm6
+ .byte 15,89,244 // mulps %xmm4,%xmm6
+ .byte 15,40,232 // movaps %xmm0,%xmm5
+ .byte 15,89,109,216 // mulps -0x28(%ebp),%xmm5
+ .byte 15,40,254 // movaps %xmm6,%xmm7
+ .byte 15,89,125,184 // mulps -0x48(%ebp),%xmm7
+ .byte 15,88,253 // addps %xmm5,%xmm7
+ .byte 15,40,109,168 // movaps -0x58(%ebp),%xmm5
+ .byte 15,92,235 // subps %xmm3,%xmm5
+ .byte 15,41,109,168 // movaps %xmm5,-0x58(%ebp)
+ .byte 15,40,109,200 // movaps -0x38(%ebp),%xmm5
.byte 15,89,213 // mulps %xmm5,%xmm2
- .byte 15,88,208 // addps %xmm0,%xmm2
- .byte 15,40,198 // movaps %xmm6,%xmm0
- .byte 15,89,196 // mulps %xmm4,%xmm0
+ .byte 15,41,93,232 // movaps %xmm3,-0x18(%ebp)
+ .byte 15,40,101,232 // movaps -0x18(%ebp),%xmm4
+ .byte 15,89,229 // mulps %xmm5,%xmm4
+ .byte 15,41,101,232 // movaps %xmm4,-0x18(%ebp)
+ .byte 15,88,235 // addps %xmm3,%xmm5
+ .byte 15,41,109,200 // movaps %xmm5,-0x38(%ebp)
+ .byte 15,40,235 // movaps %xmm3,%xmm5
+ .byte 15,89,109,152 // mulps -0x68(%ebp),%xmm5
+ .byte 15,40,221 // movaps %xmm5,%xmm3
+ .byte 15,89,217 // mulps %xmm1,%xmm3
+ .byte 15,88,223 // addps %xmm7,%xmm3
+ .byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,88,194 // addps %xmm2,%xmm0
- .byte 15,87,246 // xorps %xmm6,%xmm6
- .byte 15,194,241,2 // cmpleps %xmm1,%xmm6
- .byte 15,40,208 // movaps %xmm0,%xmm2
- .byte 15,92,209 // subps %xmm1,%xmm2
- .byte 15,41,85,216 // movaps %xmm2,-0x28(%ebp)
- .byte 15,40,203 // movaps %xmm3,%xmm1
- .byte 15,92,200 // subps %xmm0,%xmm1
- .byte 15,89,200 // mulps %xmm0,%xmm1
- .byte 15,94,202 // divps %xmm2,%xmm1
- .byte 15,88,200 // addps %xmm0,%xmm1
- .byte 15,40,214 // movaps %xmm6,%xmm2
- .byte 15,85,209 // andnps %xmm1,%xmm2
- .byte 15,84,222 // andps %xmm6,%xmm3
- .byte 15,86,218 // orps %xmm2,%xmm3
- .byte 15,40,101,200 // movaps -0x38(%ebp),%xmm4
- .byte 15,40,204 // movaps %xmm4,%xmm1
- .byte 15,40,85,88 // movaps 0x58(%ebp),%xmm2
+ .byte 15,88,242 // addps %xmm2,%xmm6
+ .byte 15,88,213 // addps %xmm5,%xmm2
+ .byte 15,40,222 // movaps %xmm6,%xmm3
+ .byte 15,93,218 // minps %xmm2,%xmm3
+ .byte 15,40,224 // movaps %xmm0,%xmm4
+ .byte 15,93,227 // minps %xmm3,%xmm4
+ .byte 15,40,222 // movaps %xmm6,%xmm3
+ .byte 15,95,218 // maxps %xmm2,%xmm3
+ .byte 15,40,232 // movaps %xmm0,%xmm5
+ .byte 15,95,235 // maxps %xmm3,%xmm5
+ .byte 15,40,93,216 // movaps -0x28(%ebp),%xmm3
+ .byte 15,89,216 // mulps %xmm0,%xmm3
+ .byte 15,40,125,184 // movaps -0x48(%ebp),%xmm7
+ .byte 15,89,254 // mulps %xmm6,%xmm7
+ .byte 15,88,251 // addps %xmm3,%xmm7
.byte 15,89,202 // mulps %xmm2,%xmm1
- .byte 15,40,85,168 // movaps -0x58(%ebp),%xmm2
- .byte 15,92,212 // subps %xmm4,%xmm2
- .byte 15,41,85,168 // movaps %xmm2,-0x58(%ebp)
- .byte 15,88,101,88 // addps 0x58(%ebp),%xmm4
+ .byte 15,88,207 // addps %xmm7,%xmm1
+ .byte 15,87,255 // xorps %xmm7,%xmm7
+ .byte 15,194,252,2 // cmpleps %xmm4,%xmm7
+ .byte 15,40,217 // movaps %xmm1,%xmm3
+ .byte 15,92,220 // subps %xmm4,%xmm3
+ .byte 15,41,93,184 // movaps %xmm3,-0x48(%ebp)
+ .byte 15,40,224 // movaps %xmm0,%xmm4
.byte 15,92,225 // subps %xmm1,%xmm4
- .byte 15,41,101,200 // movaps %xmm4,-0x38(%ebp)
- .byte 15,40,209 // movaps %xmm1,%xmm2
- .byte 15,40,225 // movaps %xmm1,%xmm4
- .byte 15,194,231,1 // cmpltps %xmm7,%xmm4
- .byte 15,40,204 // movaps %xmm4,%xmm1
- .byte 15,85,203 // andnps %xmm3,%xmm1
- .byte 15,92,216 // subps %xmm0,%xmm3
- .byte 15,92,208 // subps %xmm0,%xmm2
- .byte 15,41,85,184 // movaps %xmm2,-0x48(%ebp)
- .byte 15,89,218 // mulps %xmm2,%xmm3
- .byte 15,92,248 // subps %xmm0,%xmm7
- .byte 15,94,223 // divps %xmm7,%xmm3
- .byte 15,88,216 // addps %xmm0,%xmm3
- .byte 15,84,220 // andps %xmm4,%xmm3
- .byte 15,86,217 // orps %xmm1,%xmm3
- .byte 15,40,205 // movaps %xmm5,%xmm1
- .byte 15,92,200 // subps %xmm0,%xmm1
- .byte 15,89,200 // mulps %xmm0,%xmm1
- .byte 15,94,77,216 // divps -0x28(%ebp),%xmm1
- .byte 15,88,200 // addps %xmm0,%xmm1
- .byte 15,40,214 // movaps %xmm6,%xmm2
- .byte 15,85,209 // andnps %xmm1,%xmm2
- .byte 15,84,238 // andps %xmm6,%xmm5
- .byte 15,86,234 // orps %xmm2,%xmm5
- .byte 15,40,204 // movaps %xmm4,%xmm1
- .byte 15,40,213 // movaps %xmm5,%xmm2
- .byte 15,85,202 // andnps %xmm2,%xmm1
- .byte 15,92,208 // subps %xmm0,%xmm2
- .byte 15,40,109,184 // movaps -0x48(%ebp),%xmm5
- .byte 15,89,213 // mulps %xmm5,%xmm2
- .byte 15,94,215 // divps %xmm7,%xmm2
- .byte 15,88,208 // addps %xmm0,%xmm2
- .byte 15,84,212 // andps %xmm4,%xmm2
- .byte 15,86,209 // orps %xmm1,%xmm2
- .byte 15,41,85,152 // movaps %xmm2,-0x68(%ebp)
- .byte 15,40,85,136 // movaps -0x78(%ebp),%xmm2
- .byte 15,40,202 // movaps %xmm2,%xmm1
- .byte 15,92,200 // subps %xmm0,%xmm1
- .byte 15,89,200 // mulps %xmm0,%xmm1
- .byte 15,94,77,216 // divps -0x28(%ebp),%xmm1
- .byte 15,88,200 // addps %xmm0,%xmm1
- .byte 15,84,214 // andps %xmm6,%xmm2
- .byte 15,85,241 // andnps %xmm1,%xmm6
- .byte 15,86,242 // orps %xmm2,%xmm6
- .byte 15,40,204 // movaps %xmm4,%xmm1
- .byte 15,85,206 // andnps %xmm6,%xmm1
- .byte 15,92,240 // subps %xmm0,%xmm6
- .byte 15,89,245 // mulps %xmm5,%xmm6
- .byte 15,94,247 // divps %xmm7,%xmm6
- .byte 15,88,240 // addps %xmm0,%xmm6
+ .byte 15,89,225 // mulps %xmm1,%xmm4
+ .byte 15,94,227 // divps %xmm3,%xmm4
+ .byte 15,88,225 // addps %xmm1,%xmm4
+ .byte 15,40,223 // movaps %xmm7,%xmm3
+ .byte 15,85,220 // andnps %xmm4,%xmm3
+ .byte 15,84,199 // andps %xmm7,%xmm0
+ .byte 15,86,195 // orps %xmm3,%xmm0
+ .byte 15,40,93,200 // movaps -0x38(%ebp),%xmm3
+ .byte 15,40,101,232 // movaps -0x18(%ebp),%xmm4
+ .byte 15,92,220 // subps %xmm4,%xmm3
+ .byte 15,41,93,200 // movaps %xmm3,-0x38(%ebp)
+ .byte 15,41,101,216 // movaps %xmm4,-0x28(%ebp)
+ .byte 15,194,229,1 // cmpltps %xmm5,%xmm4
+ .byte 15,40,220 // movaps %xmm4,%xmm3
+ .byte 15,85,216 // andnps %xmm0,%xmm3
+ .byte 15,41,93,232 // movaps %xmm3,-0x18(%ebp)
+ .byte 15,92,193 // subps %xmm1,%xmm0
+ .byte 15,40,93,216 // movaps -0x28(%ebp),%xmm3
+ .byte 15,92,217 // subps %xmm1,%xmm3
+ .byte 15,41,93,216 // movaps %xmm3,-0x28(%ebp)
+ .byte 15,89,195 // mulps %xmm3,%xmm0
+ .byte 15,92,233 // subps %xmm1,%xmm5
+ .byte 15,41,109,136 // movaps %xmm5,-0x78(%ebp)
+ .byte 15,94,197 // divps %xmm5,%xmm0
+ .byte 15,88,193 // addps %xmm1,%xmm0
+ .byte 15,84,196 // andps %xmm4,%xmm0
+ .byte 15,86,69,232 // orps -0x18(%ebp),%xmm0
+ .byte 15,40,222 // movaps %xmm6,%xmm3
+ .byte 15,92,217 // subps %xmm1,%xmm3
+ .byte 15,89,217 // mulps %xmm1,%xmm3
+ .byte 15,94,93,184 // divps -0x48(%ebp),%xmm3
+ .byte 15,88,217 // addps %xmm1,%xmm3
+ .byte 15,41,125,232 // movaps %xmm7,-0x18(%ebp)
+ .byte 15,40,109,232 // movaps -0x18(%ebp),%xmm5
+ .byte 15,85,235 // andnps %xmm3,%xmm5
+ .byte 15,41,109,232 // movaps %xmm5,-0x18(%ebp)
+ .byte 15,84,247 // andps %xmm7,%xmm6
+ .byte 15,86,117,232 // orps -0x18(%ebp),%xmm6
+ .byte 15,40,220 // movaps %xmm4,%xmm3
+ .byte 15,85,222 // andnps %xmm6,%xmm3
+ .byte 15,92,241 // subps %xmm1,%xmm6
+ .byte 15,89,117,216 // mulps -0x28(%ebp),%xmm6
+ .byte 15,40,109,136 // movaps -0x78(%ebp),%xmm5
+ .byte 15,94,245 // divps %xmm5,%xmm6
+ .byte 15,88,241 // addps %xmm1,%xmm6
.byte 15,84,244 // andps %xmm4,%xmm6
- .byte 15,86,241 // orps %xmm1,%xmm6
- .byte 15,87,192 // xorps %xmm0,%xmm0
- .byte 15,95,216 // maxps %xmm0,%xmm3
- .byte 15,40,101,152 // movaps -0x68(%ebp),%xmm4
- .byte 15,95,224 // maxps %xmm0,%xmm4
- .byte 15,95,240 // maxps %xmm0,%xmm6
- .byte 15,40,109,168 // movaps -0x58(%ebp),%xmm5
- .byte 15,40,197 // movaps %xmm5,%xmm0
- .byte 15,40,125,40 // movaps 0x28(%ebp),%xmm7
- .byte 15,89,199 // mulps %xmm7,%xmm0
- .byte 15,40,141,88,255,255,255 // movaps -0xa8(%ebp),%xmm1
+ .byte 15,86,243 // orps %xmm3,%xmm6
+ .byte 15,40,218 // movaps %xmm2,%xmm3
+ .byte 15,92,217 // subps %xmm1,%xmm3
+ .byte 15,89,217 // mulps %xmm1,%xmm3
+ .byte 15,94,93,184 // divps -0x48(%ebp),%xmm3
+ .byte 15,88,217 // addps %xmm1,%xmm3
+ .byte 15,84,215 // andps %xmm7,%xmm2
+ .byte 15,85,251 // andnps %xmm3,%xmm7
+ .byte 15,86,250 // orps %xmm2,%xmm7
+ .byte 15,40,212 // movaps %xmm4,%xmm2
+ .byte 15,85,215 // andnps %xmm7,%xmm2
+ .byte 15,92,249 // subps %xmm1,%xmm7
+ .byte 15,89,125,216 // mulps -0x28(%ebp),%xmm7
+ .byte 15,94,253 // divps %xmm5,%xmm7
+ .byte 15,88,249 // addps %xmm1,%xmm7
+ .byte 15,84,252 // andps %xmm4,%xmm7
+ .byte 15,86,250 // orps %xmm2,%xmm7
+ .byte 15,87,201 // xorps %xmm1,%xmm1
+ .byte 15,95,193 // maxps %xmm1,%xmm0
+ .byte 15,95,241 // maxps %xmm1,%xmm6
+ .byte 15,95,249 // maxps %xmm1,%xmm7
+ .byte 15,40,141,120,255,255,255 // movaps -0x88(%ebp),%xmm1
+ .byte 15,40,85,168 // movaps -0x58(%ebp),%xmm2
+ .byte 15,89,202 // mulps %xmm2,%xmm1
+ .byte 15,88,141,56,255,255,255 // addps -0xc8(%ebp),%xmm1
.byte 15,88,200 // addps %xmm0,%xmm1
- .byte 15,88,203 // addps %xmm3,%xmm1
.byte 15,40,193 // movaps %xmm1,%xmm0
- .byte 15,40,213 // movaps %xmm5,%xmm2
- .byte 15,40,93,56 // movaps 0x38(%ebp),%xmm3
+ .byte 15,40,141,104,255,255,255 // movaps -0x98(%ebp),%xmm1
+ .byte 15,89,202 // mulps %xmm2,%xmm1
+ .byte 15,40,218 // movaps %xmm2,%xmm3
+ .byte 15,88,141,88,255,255,255 // addps -0xa8(%ebp),%xmm1
+ .byte 15,88,206 // addps %xmm6,%xmm1
+ .byte 15,40,85,152 // movaps -0x68(%ebp),%xmm2
.byte 15,89,211 // mulps %xmm3,%xmm2
- .byte 15,40,141,120,255,255,255 // movaps -0x88(%ebp),%xmm1
- .byte 15,88,202 // addps %xmm2,%xmm1
- .byte 15,88,204 // addps %xmm4,%xmm1
- .byte 15,40,85,72 // movaps 0x48(%ebp),%xmm2
- .byte 15,40,226 // movaps %xmm2,%xmm4
- .byte 15,89,236 // mulps %xmm4,%xmm5
- .byte 15,88,173,104,255,255,255 // addps -0x98(%ebp),%xmm5
- .byte 15,88,238 // addps %xmm6,%xmm5
- .byte 15,40,213 // movaps %xmm5,%xmm2
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
- .byte 139,85,20 // mov 0x14(%ebp),%edx
- .byte 139,117,24 // mov 0x18(%ebp),%esi
- .byte 139,125,12 // mov 0xc(%ebp),%edi
- .byte 141,95,4 // lea 0x4(%edi),%ebx
- .byte 15,40,109,88 // movaps 0x58(%ebp),%xmm5
- .byte 15,41,108,36,80 // movaps %xmm5,0x50(%esp)
- .byte 15,41,100,36,64 // movaps %xmm4,0x40(%esp)
- .byte 15,41,92,36,48 // movaps %xmm3,0x30(%esp)
- .byte 15,41,124,36,32 // movaps %xmm7,0x20(%esp)
- .byte 137,116,36,16 // mov %esi,0x10(%esp)
- .byte 137,84,36,12 // mov %edx,0xc(%esp)
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
+ .byte 15,88,149,72,255,255,255 // addps -0xb8(%ebp),%xmm2
+ .byte 15,88,215 // addps %xmm7,%xmm2
+ .byte 139,77,12 // mov 0xc(%ebp),%ecx
+ .byte 141,81,4 // lea 0x4(%ecx),%edx
+ .byte 131,236,8 // sub $0x8,%esp
.byte 15,40,93,200 // movaps -0x38(%ebp),%xmm3
- .byte 255,23 // call *(%edi)
- .byte 129,196,28,1,0,0 // add $0x11c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 82 // push %edx
+ .byte 80 // push %eax
+ .byte 255,17 // call *(%ecx)
+ .byte 129,196,216,0,0,0 // add $0xd8,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -51478,194 +50889,179 @@ FUNCTION(_sk_luminosity_sse2)
_sk_luminosity_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 129,236,252,0,0,0 // sub $0xfc,%esp
- .byte 15,40,243 // movaps %xmm3,%xmm6
- .byte 15,40,234 // movaps %xmm2,%xmm5
- .byte 15,40,216 // movaps %xmm0,%xmm3
- .byte 232,0,0,0,0 // call 218d <_sk_luminosity_sse2+0x1a>
- .byte 88 // pop %eax
- .byte 15,40,160,99,114,0,0 // movaps 0x7263(%eax),%xmm4
- .byte 15,41,101,216 // movaps %xmm4,-0x28(%ebp)
- .byte 15,40,211 // movaps %xmm3,%xmm2
+ .byte 129,236,184,0,0,0 // sub $0xb8,%esp
+ .byte 15,40,242 // movaps %xmm2,%xmm6
+ .byte 232,0,0,0,0 // call 1a03 <_sk_luminosity_sse2+0x11>
+ .byte 89 // pop %ecx
+ .byte 139,69,8 // mov 0x8(%ebp),%eax
+ .byte 15,40,161,253,86,0,0 // movaps 0x56fd(%ecx),%xmm4
+ .byte 15,41,101,232 // movaps %xmm4,-0x18(%ebp)
+ .byte 15,40,208 // movaps %xmm0,%xmm2
.byte 15,89,212 // mulps %xmm4,%xmm2
- .byte 15,40,128,115,114,0,0 // movaps 0x7273(%eax),%xmm0
- .byte 15,41,69,200 // movaps %xmm0,-0x38(%ebp)
- .byte 15,40,225 // movaps %xmm1,%xmm4
- .byte 15,89,224 // mulps %xmm0,%xmm4
- .byte 15,88,226 // addps %xmm2,%xmm4
- .byte 15,40,85,88 // movaps 0x58(%ebp),%xmm2
- .byte 15,40,184,147,114,0,0 // movaps 0x7293(%eax),%xmm7
- .byte 15,41,125,152 // movaps %xmm7,-0x68(%ebp)
+ .byte 15,40,161,13,87,0,0 // movaps 0x570d(%ecx),%xmm4
+ .byte 15,41,101,216 // movaps %xmm4,-0x28(%ebp)
+ .byte 15,40,233 // movaps %xmm1,%xmm5
+ .byte 15,89,236 // mulps %xmm4,%xmm5
+ .byte 15,88,234 // addps %xmm2,%xmm5
+ .byte 15,40,80,64 // movaps 0x40(%eax),%xmm2
+ .byte 15,41,85,184 // movaps %xmm2,-0x48(%ebp)
+ .byte 15,40,161,45,87,0,0 // movaps 0x572d(%ecx),%xmm4
+ .byte 15,40,252 // movaps %xmm4,%xmm7
.byte 15,92,250 // subps %xmm2,%xmm7
- .byte 15,89,223 // mulps %xmm7,%xmm3
- .byte 15,41,157,88,255,255,255 // movaps %xmm3,-0xa8(%ebp)
+ .byte 15,89,199 // mulps %xmm7,%xmm0
+ .byte 15,41,133,72,255,255,255 // movaps %xmm0,-0xb8(%ebp)
.byte 15,89,207 // mulps %xmm7,%xmm1
- .byte 15,41,141,104,255,255,255 // movaps %xmm1,-0x98(%ebp)
- .byte 15,89,253 // mulps %xmm5,%xmm7
- .byte 15,41,189,120,255,255,255 // movaps %xmm7,-0x88(%ebp)
- .byte 15,40,205 // movaps %xmm5,%xmm1
- .byte 15,40,128,131,114,0,0 // movaps 0x7283(%eax),%xmm0
- .byte 15,89,200 // mulps %xmm0,%xmm1
- .byte 15,88,204 // addps %xmm4,%xmm1
- .byte 15,40,238 // movaps %xmm6,%xmm5
- .byte 15,89,109,40 // mulps 0x28(%ebp),%xmm5
- .byte 15,40,222 // movaps %xmm6,%xmm3
- .byte 15,41,117,168 // movaps %xmm6,-0x58(%ebp)
- .byte 15,89,93,56 // mulps 0x38(%ebp),%xmm3
- .byte 15,40,229 // movaps %xmm5,%xmm4
- .byte 15,89,101,216 // mulps -0x28(%ebp),%xmm4
- .byte 15,40,211 // movaps %xmm3,%xmm2
- .byte 15,89,85,200 // mulps -0x38(%ebp),%xmm2
- .byte 15,88,212 // addps %xmm4,%xmm2
- .byte 15,89,117,72 // mulps 0x48(%ebp),%xmm6
- .byte 15,40,230 // movaps %xmm6,%xmm4
- .byte 15,89,224 // mulps %xmm0,%xmm4
- .byte 15,88,226 // addps %xmm2,%xmm4
- .byte 15,40,85,88 // movaps 0x58(%ebp),%xmm2
- .byte 15,89,202 // mulps %xmm2,%xmm1
- .byte 15,92,204 // subps %xmm4,%xmm1
- .byte 15,88,233 // addps %xmm1,%xmm5
- .byte 15,88,217 // addps %xmm1,%xmm3
- .byte 15,88,206 // addps %xmm6,%xmm1
- .byte 15,40,211 // movaps %xmm3,%xmm2
- .byte 15,93,209 // minps %xmm1,%xmm2
- .byte 15,40,229 // movaps %xmm5,%xmm4
- .byte 15,93,226 // minps %xmm2,%xmm4
- .byte 15,40,243 // movaps %xmm3,%xmm6
- .byte 15,95,241 // maxps %xmm1,%xmm6
- .byte 15,40,213 // movaps %xmm5,%xmm2
- .byte 15,95,214 // maxps %xmm6,%xmm2
- .byte 15,41,85,184 // movaps %xmm2,-0x48(%ebp)
- .byte 15,40,85,216 // movaps -0x28(%ebp),%xmm2
- .byte 15,89,213 // mulps %xmm5,%xmm2
- .byte 15,40,117,200 // movaps -0x38(%ebp),%xmm6
+ .byte 15,41,141,88,255,255,255 // movaps %xmm1,-0xa8(%ebp)
+ .byte 15,89,254 // mulps %xmm6,%xmm7
+ .byte 15,41,189,104,255,255,255 // movaps %xmm7,-0x98(%ebp)
+ .byte 15,40,214 // movaps %xmm6,%xmm2
+ .byte 15,40,137,29,87,0,0 // movaps 0x571d(%ecx),%xmm1
+ .byte 15,89,209 // mulps %xmm1,%xmm2
+ .byte 15,88,213 // addps %xmm5,%xmm2
+ .byte 15,40,104,16 // movaps 0x10(%eax),%xmm5
+ .byte 15,41,109,136 // movaps %xmm5,-0x78(%ebp)
+ .byte 15,89,235 // mulps %xmm3,%xmm5
+ .byte 15,40,112,32 // movaps 0x20(%eax),%xmm6
+ .byte 15,41,117,152 // movaps %xmm6,-0x68(%ebp)
.byte 15,89,243 // mulps %xmm3,%xmm6
- .byte 15,88,242 // addps %xmm2,%xmm6
+ .byte 15,40,197 // movaps %xmm5,%xmm0
+ .byte 15,89,69,232 // mulps -0x18(%ebp),%xmm0
+ .byte 15,40,254 // movaps %xmm6,%xmm7
+ .byte 15,89,125,216 // mulps -0x28(%ebp),%xmm7
+ .byte 15,88,248 // addps %xmm0,%xmm7
+ .byte 15,92,227 // subps %xmm3,%xmm4
+ .byte 15,41,93,168 // movaps %xmm3,-0x58(%ebp)
+ .byte 15,40,69,136 // movaps -0x78(%ebp),%xmm0
+ .byte 15,89,196 // mulps %xmm4,%xmm0
+ .byte 15,41,69,136 // movaps %xmm0,-0x78(%ebp)
+ .byte 15,40,69,152 // movaps -0x68(%ebp),%xmm0
+ .byte 15,89,196 // mulps %xmm4,%xmm0
+ .byte 15,41,69,152 // movaps %xmm0,-0x68(%ebp)
+ .byte 15,40,64,48 // movaps 0x30(%eax),%xmm0
+ .byte 15,89,224 // mulps %xmm0,%xmm4
+ .byte 15,41,165,120,255,255,255 // movaps %xmm4,-0x88(%ebp)
+ .byte 15,40,224 // movaps %xmm0,%xmm4
+ .byte 15,89,227 // mulps %xmm3,%xmm4
+ .byte 15,40,196 // movaps %xmm4,%xmm0
.byte 15,89,193 // mulps %xmm1,%xmm0
- .byte 15,88,198 // addps %xmm6,%xmm0
- .byte 15,87,255 // xorps %xmm7,%xmm7
- .byte 15,194,252,2 // cmpleps %xmm4,%xmm7
- .byte 15,40,208 // movaps %xmm0,%xmm2
- .byte 15,92,212 // subps %xmm4,%xmm2
- .byte 15,41,85,200 // movaps %xmm2,-0x38(%ebp)
+ .byte 15,88,199 // addps %xmm7,%xmm0
+ .byte 15,40,93,184 // movaps -0x48(%ebp),%xmm3
+ .byte 15,89,211 // mulps %xmm3,%xmm2
+ .byte 15,92,208 // subps %xmm0,%xmm2
+ .byte 15,88,234 // addps %xmm2,%xmm5
+ .byte 15,88,242 // addps %xmm2,%xmm6
+ .byte 15,88,212 // addps %xmm4,%xmm2
+ .byte 15,40,198 // movaps %xmm6,%xmm0
+ .byte 15,93,194 // minps %xmm2,%xmm0
.byte 15,40,229 // movaps %xmm5,%xmm4
- .byte 15,92,224 // subps %xmm0,%xmm4
- .byte 15,89,224 // mulps %xmm0,%xmm4
- .byte 15,94,226 // divps %xmm2,%xmm4
- .byte 15,88,224 // addps %xmm0,%xmm4
- .byte 15,40,215 // movaps %xmm7,%xmm2
- .byte 15,85,212 // andnps %xmm4,%xmm2
- .byte 15,84,239 // andps %xmm7,%xmm5
- .byte 15,86,234 // orps %xmm2,%xmm5
- .byte 15,40,101,168 // movaps -0x58(%ebp),%xmm4
- .byte 15,40,212 // movaps %xmm4,%xmm2
- .byte 15,40,117,88 // movaps 0x58(%ebp),%xmm6
- .byte 15,89,214 // mulps %xmm6,%xmm2
- .byte 15,40,117,152 // movaps -0x68(%ebp),%xmm6
- .byte 15,92,244 // subps %xmm4,%xmm6
- .byte 15,41,117,152 // movaps %xmm6,-0x68(%ebp)
- .byte 15,88,101,88 // addps 0x58(%ebp),%xmm4
- .byte 15,92,226 // subps %xmm2,%xmm4
- .byte 15,41,101,168 // movaps %xmm4,-0x58(%ebp)
- .byte 15,41,85,216 // movaps %xmm2,-0x28(%ebp)
- .byte 15,40,117,184 // movaps -0x48(%ebp),%xmm6
- .byte 15,194,214,1 // cmpltps %xmm6,%xmm2
- .byte 15,40,226 // movaps %xmm2,%xmm4
+ .byte 15,93,224 // minps %xmm0,%xmm4
+ .byte 15,40,198 // movaps %xmm6,%xmm0
+ .byte 15,95,194 // maxps %xmm2,%xmm0
+ .byte 15,40,253 // movaps %xmm5,%xmm7
+ .byte 15,95,248 // maxps %xmm0,%xmm7
+ .byte 15,41,125,200 // movaps %xmm7,-0x38(%ebp)
+ .byte 15,40,69,232 // movaps -0x18(%ebp),%xmm0
+ .byte 15,89,197 // mulps %xmm5,%xmm0
+ .byte 15,40,125,216 // movaps -0x28(%ebp),%xmm7
+ .byte 15,89,254 // mulps %xmm6,%xmm7
+ .byte 15,88,248 // addps %xmm0,%xmm7
+ .byte 15,89,202 // mulps %xmm2,%xmm1
+ .byte 15,88,207 // addps %xmm7,%xmm1
+ .byte 15,87,192 // xorps %xmm0,%xmm0
+ .byte 15,194,196,2 // cmpleps %xmm4,%xmm0
+ .byte 15,40,249 // movaps %xmm1,%xmm7
+ .byte 15,92,252 // subps %xmm4,%xmm7
+ .byte 15,41,125,216 // movaps %xmm7,-0x28(%ebp)
+ .byte 15,40,229 // movaps %xmm5,%xmm4
+ .byte 15,92,225 // subps %xmm1,%xmm4
+ .byte 15,89,225 // mulps %xmm1,%xmm4
+ .byte 15,94,231 // divps %xmm7,%xmm4
+ .byte 15,88,225 // addps %xmm1,%xmm4
+ .byte 15,40,248 // movaps %xmm0,%xmm7
+ .byte 15,85,252 // andnps %xmm4,%xmm7
+ .byte 15,84,232 // andps %xmm0,%xmm5
+ .byte 15,86,239 // orps %xmm7,%xmm5
+ .byte 15,40,251 // movaps %xmm3,%xmm7
+ .byte 15,40,231 // movaps %xmm7,%xmm4
+ .byte 15,40,93,168 // movaps -0x58(%ebp),%xmm3
+ .byte 15,89,227 // mulps %xmm3,%xmm4
+ .byte 15,88,223 // addps %xmm7,%xmm3
+ .byte 15,92,220 // subps %xmm4,%xmm3
+ .byte 15,41,93,168 // movaps %xmm3,-0x58(%ebp)
+ .byte 15,41,101,232 // movaps %xmm4,-0x18(%ebp)
+ .byte 15,40,220 // movaps %xmm4,%xmm3
+ .byte 15,40,125,200 // movaps -0x38(%ebp),%xmm7
+ .byte 15,194,223,1 // cmpltps %xmm7,%xmm3
+ .byte 15,40,227 // movaps %xmm3,%xmm4
.byte 15,85,229 // andnps %xmm5,%xmm4
- .byte 15,41,101,136 // movaps %xmm4,-0x78(%ebp)
- .byte 15,92,232 // subps %xmm0,%xmm5
- .byte 15,40,101,216 // movaps -0x28(%ebp),%xmm4
- .byte 15,92,224 // subps %xmm0,%xmm4
- .byte 15,41,101,216 // movaps %xmm4,-0x28(%ebp)
+ .byte 15,41,101,184 // movaps %xmm4,-0x48(%ebp)
+ .byte 15,92,233 // subps %xmm1,%xmm5
+ .byte 15,40,101,232 // movaps -0x18(%ebp),%xmm4
+ .byte 15,92,225 // subps %xmm1,%xmm4
+ .byte 15,41,101,232 // movaps %xmm4,-0x18(%ebp)
.byte 15,89,236 // mulps %xmm4,%xmm5
- .byte 15,92,240 // subps %xmm0,%xmm6
- .byte 15,41,117,184 // movaps %xmm6,-0x48(%ebp)
- .byte 15,94,238 // divps %xmm6,%xmm5
- .byte 15,88,232 // addps %xmm0,%xmm5
- .byte 15,84,234 // andps %xmm2,%xmm5
- .byte 15,86,109,136 // orps -0x78(%ebp),%xmm5
+ .byte 15,92,249 // subps %xmm1,%xmm7
+ .byte 15,41,125,200 // movaps %xmm7,-0x38(%ebp)
+ .byte 15,94,239 // divps %xmm7,%xmm5
+ .byte 15,88,233 // addps %xmm1,%xmm5
+ .byte 15,84,235 // andps %xmm3,%xmm5
+ .byte 15,86,109,184 // orps -0x48(%ebp),%xmm5
+ .byte 15,40,230 // movaps %xmm6,%xmm4
+ .byte 15,92,225 // subps %xmm1,%xmm4
+ .byte 15,89,225 // mulps %xmm1,%xmm4
+ .byte 15,94,101,216 // divps -0x28(%ebp),%xmm4
+ .byte 15,88,225 // addps %xmm1,%xmm4
+ .byte 15,40,248 // movaps %xmm0,%xmm7
+ .byte 15,85,252 // andnps %xmm4,%xmm7
+ .byte 15,84,240 // andps %xmm0,%xmm6
+ .byte 15,86,247 // orps %xmm7,%xmm6
.byte 15,40,227 // movaps %xmm3,%xmm4
- .byte 15,92,224 // subps %xmm0,%xmm4
- .byte 15,89,224 // mulps %xmm0,%xmm4
- .byte 15,94,101,200 // divps -0x38(%ebp),%xmm4
- .byte 15,88,224 // addps %xmm0,%xmm4
- .byte 15,40,247 // movaps %xmm7,%xmm6
- .byte 15,85,244 // andnps %xmm4,%xmm6
- .byte 15,84,223 // andps %xmm7,%xmm3
- .byte 15,86,222 // orps %xmm6,%xmm3
+ .byte 15,85,230 // andnps %xmm6,%xmm4
+ .byte 15,92,241 // subps %xmm1,%xmm6
+ .byte 15,40,125,232 // movaps -0x18(%ebp),%xmm7
+ .byte 15,89,247 // mulps %xmm7,%xmm6
+ .byte 15,94,117,200 // divps -0x38(%ebp),%xmm6
+ .byte 15,88,241 // addps %xmm1,%xmm6
+ .byte 15,84,243 // andps %xmm3,%xmm6
+ .byte 15,86,244 // orps %xmm4,%xmm6
.byte 15,40,226 // movaps %xmm2,%xmm4
- .byte 15,85,227 // andnps %xmm3,%xmm4
- .byte 15,92,216 // subps %xmm0,%xmm3
- .byte 15,40,117,216 // movaps -0x28(%ebp),%xmm6
- .byte 15,89,222 // mulps %xmm6,%xmm3
- .byte 15,94,93,184 // divps -0x48(%ebp),%xmm3
- .byte 15,88,216 // addps %xmm0,%xmm3
- .byte 15,84,218 // andps %xmm2,%xmm3
- .byte 15,86,220 // orps %xmm4,%xmm3
- .byte 15,40,225 // movaps %xmm1,%xmm4
- .byte 15,92,224 // subps %xmm0,%xmm4
- .byte 15,89,224 // mulps %xmm0,%xmm4
- .byte 15,94,101,200 // divps -0x38(%ebp),%xmm4
- .byte 15,88,224 // addps %xmm0,%xmm4
- .byte 15,84,207 // andps %xmm7,%xmm1
- .byte 15,85,252 // andnps %xmm4,%xmm7
- .byte 15,86,249 // orps %xmm1,%xmm7
- .byte 15,40,202 // movaps %xmm2,%xmm1
- .byte 15,85,207 // andnps %xmm7,%xmm1
- .byte 15,92,248 // subps %xmm0,%xmm7
- .byte 15,89,254 // mulps %xmm6,%xmm7
- .byte 15,94,125,184 // divps -0x48(%ebp),%xmm7
- .byte 15,88,248 // addps %xmm0,%xmm7
- .byte 15,84,250 // andps %xmm2,%xmm7
- .byte 15,86,249 // orps %xmm1,%xmm7
- .byte 15,87,192 // xorps %xmm0,%xmm0
- .byte 15,95,232 // maxps %xmm0,%xmm5
- .byte 15,95,216 // maxps %xmm0,%xmm3
- .byte 15,95,248 // maxps %xmm0,%xmm7
- .byte 15,40,101,152 // movaps -0x68(%ebp),%xmm4
- .byte 15,40,196 // movaps %xmm4,%xmm0
- .byte 15,40,117,40 // movaps 0x28(%ebp),%xmm6
- .byte 15,89,198 // mulps %xmm6,%xmm0
+ .byte 15,92,225 // subps %xmm1,%xmm4
+ .byte 15,89,225 // mulps %xmm1,%xmm4
+ .byte 15,94,101,216 // divps -0x28(%ebp),%xmm4
+ .byte 15,88,225 // addps %xmm1,%xmm4
+ .byte 15,84,208 // andps %xmm0,%xmm2
+ .byte 15,85,196 // andnps %xmm4,%xmm0
+ .byte 15,86,194 // orps %xmm2,%xmm0
+ .byte 15,40,211 // movaps %xmm3,%xmm2
+ .byte 15,85,208 // andnps %xmm0,%xmm2
+ .byte 15,92,193 // subps %xmm1,%xmm0
+ .byte 15,89,199 // mulps %xmm7,%xmm0
+ .byte 15,94,69,200 // divps -0x38(%ebp),%xmm0
+ .byte 15,88,193 // addps %xmm1,%xmm0
+ .byte 15,84,195 // andps %xmm3,%xmm0
+ .byte 15,86,194 // orps %xmm2,%xmm0
+ .byte 15,87,201 // xorps %xmm1,%xmm1
+ .byte 15,95,233 // maxps %xmm1,%xmm5
+ .byte 15,95,241 // maxps %xmm1,%xmm6
+ .byte 15,95,193 // maxps %xmm1,%xmm0
+ .byte 15,40,157,72,255,255,255 // movaps -0xb8(%ebp),%xmm3
+ .byte 15,88,93,136 // addps -0x78(%ebp),%xmm3
+ .byte 15,88,221 // addps %xmm5,%xmm3
.byte 15,40,141,88,255,255,255 // movaps -0xa8(%ebp),%xmm1
- .byte 15,88,200 // addps %xmm0,%xmm1
- .byte 15,88,205 // addps %xmm5,%xmm1
- .byte 15,40,193 // movaps %xmm1,%xmm0
- .byte 15,40,212 // movaps %xmm4,%xmm2
- .byte 15,40,109,56 // movaps 0x38(%ebp),%xmm5
- .byte 15,89,213 // mulps %xmm5,%xmm2
- .byte 15,40,141,104,255,255,255 // movaps -0x98(%ebp),%xmm1
- .byte 15,88,202 // addps %xmm2,%xmm1
- .byte 15,88,203 // addps %xmm3,%xmm1
- .byte 15,40,93,72 // movaps 0x48(%ebp),%xmm3
- .byte 15,89,227 // mulps %xmm3,%xmm4
- .byte 15,88,165,120,255,255,255 // addps -0x88(%ebp),%xmm4
- .byte 15,88,231 // addps %xmm7,%xmm4
- .byte 15,40,212 // movaps %xmm4,%xmm2
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
- .byte 139,85,20 // mov 0x14(%ebp),%edx
- .byte 139,117,24 // mov 0x18(%ebp),%esi
- .byte 139,125,12 // mov 0xc(%ebp),%edi
- .byte 141,95,4 // lea 0x4(%edi),%ebx
- .byte 15,40,101,88 // movaps 0x58(%ebp),%xmm4
- .byte 15,41,100,36,80 // movaps %xmm4,0x50(%esp)
- .byte 15,41,92,36,64 // movaps %xmm3,0x40(%esp)
- .byte 15,41,108,36,48 // movaps %xmm5,0x30(%esp)
- .byte 15,41,116,36,32 // movaps %xmm6,0x20(%esp)
- .byte 137,116,36,16 // mov %esi,0x10(%esp)
- .byte 137,84,36,12 // mov %edx,0xc(%esp)
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
+ .byte 15,88,77,152 // addps -0x68(%ebp),%xmm1
+ .byte 15,88,206 // addps %xmm6,%xmm1
+ .byte 15,40,149,120,255,255,255 // movaps -0x88(%ebp),%xmm2
+ .byte 15,88,149,104,255,255,255 // addps -0x98(%ebp),%xmm2
+ .byte 15,88,208 // addps %xmm0,%xmm2
+ .byte 139,77,12 // mov 0xc(%ebp),%ecx
+ .byte 141,81,4 // lea 0x4(%ecx),%edx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 15,40,195 // movaps %xmm3,%xmm0
.byte 15,40,93,168 // movaps -0x58(%ebp),%xmm3
- .byte 255,23 // call *(%edi)
- .byte 129,196,252,0,0,0 // add $0xfc,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 82 // push %edx
+ .byte 80 // push %eax
+ .byte 255,17 // call *(%ecx)
+ .byte 129,196,200,0,0,0 // add $0xc8,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -51678,139 +51074,117 @@ _sk_srcover_rgba_8888_sse2:
.byte 83 // push %ebx
.byte 87 // push %edi
.byte 86 // push %esi
- .byte 129,236,188,0,0,0 // sub $0xbc,%esp
- .byte 15,41,93,152 // movaps %xmm3,-0x68(%ebp)
- .byte 15,41,85,168 // movaps %xmm2,-0x58(%ebp)
- .byte 15,41,77,184 // movaps %xmm1,-0x48(%ebp)
- .byte 102,15,127,69,200 // movdqa %xmm0,-0x38(%ebp)
- .byte 232,0,0,0,0 // call 2424 <_sk_srcover_rgba_8888_sse2+0x22>
+ .byte 131,236,44 // sub $0x2c,%esp
+ .byte 102,15,127,85,200 // movdqa %xmm2,-0x38(%ebp)
+ .byte 15,41,77,216 // movaps %xmm1,-0x28(%ebp)
+ .byte 232,0,0,0,0 // call 1c6e <_sk_srcover_rgba_8888_sse2+0x17>
.byte 95 // pop %edi
- .byte 139,77,20 // mov 0x14(%ebp),%ecx
.byte 139,69,12 // mov 0xc(%ebp),%eax
- .byte 139,16 // mov (%eax),%edx
- .byte 139,114,4 // mov 0x4(%edx),%esi
- .byte 15,175,241 // imul %ecx,%esi
- .byte 193,230,2 // shl $0x2,%esi
- .byte 3,50 // add (%edx),%esi
- .byte 139,93,24 // mov 0x18(%ebp),%ebx
+ .byte 139,77,8 // mov 0x8(%ebp),%ecx
+ .byte 139,48 // mov (%eax),%esi
+ .byte 139,86,4 // mov 0x4(%esi),%edx
+ .byte 15,175,81,4 // imul 0x4(%ecx),%edx
+ .byte 193,226,2 // shl $0x2,%edx
+ .byte 3,22 // add (%esi),%edx
+ .byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
- .byte 139,85,16 // mov 0x10(%ebp),%edx
- .byte 15,133,47,1,0,0 // jne 2575 <_sk_srcover_rgba_8888_sse2+0x173>
- .byte 243,15,111,4,150 // movdqu (%esi,%edx,4),%xmm0
- .byte 102,15,111,143,12,112,0,0 // movdqa 0x700c(%edi),%xmm1
- .byte 102,15,111,208 // movdqa %xmm0,%xmm2
- .byte 102,15,219,209 // pand %xmm1,%xmm2
- .byte 102,15,111,248 // movdqa %xmm0,%xmm7
- .byte 102,15,114,215,8 // psrld $0x8,%xmm7
- .byte 102,15,219,249 // pand %xmm1,%xmm7
- .byte 102,15,111,232 // movdqa %xmm0,%xmm5
- .byte 102,15,114,213,16 // psrld $0x10,%xmm5
- .byte 102,15,219,233 // pand %xmm1,%xmm5
- .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,40,183,28,112,0,0 // movaps 0x701c(%edi),%xmm6
- .byte 15,40,93,152 // movaps -0x68(%ebp),%xmm3
- .byte 15,92,243 // subps %xmm3,%xmm6
- .byte 15,40,167,44,112,0,0 // movaps 0x702c(%edi),%xmm4
- .byte 15,41,101,216 // movaps %xmm4,-0x28(%ebp)
- .byte 15,40,77,200 // movaps -0x38(%ebp),%xmm1
- .byte 15,89,204 // mulps %xmm4,%xmm1
- .byte 15,40,230 // movaps %xmm6,%xmm4
- .byte 15,41,85,200 // movaps %xmm2,-0x38(%ebp)
- .byte 15,89,226 // mulps %xmm2,%xmm4
- .byte 15,88,225 // addps %xmm1,%xmm4
- .byte 15,91,215 // cvtdq2ps %xmm7,%xmm2
- .byte 15,40,125,184 // movaps -0x48(%ebp),%xmm7
- .byte 15,89,125,216 // mulps -0x28(%ebp),%xmm7
- .byte 15,40,206 // movaps %xmm6,%xmm1
- .byte 15,41,85,184 // movaps %xmm2,-0x48(%ebp)
- .byte 15,89,202 // mulps %xmm2,%xmm1
- .byte 15,88,207 // addps %xmm7,%xmm1
- .byte 15,91,213 // cvtdq2ps %xmm5,%xmm2
- .byte 15,40,109,168 // movaps -0x58(%ebp),%xmm5
- .byte 15,89,109,216 // mulps -0x28(%ebp),%xmm5
- .byte 15,40,254 // movaps %xmm6,%xmm7
- .byte 15,41,85,168 // movaps %xmm2,-0x58(%ebp)
- .byte 15,89,250 // mulps %xmm2,%xmm7
- .byte 15,88,253 // addps %xmm5,%xmm7
- .byte 15,89,93,216 // mulps -0x28(%ebp),%xmm3
- .byte 102,15,114,208,24 // psrld $0x18,%xmm0
- .byte 15,91,232 // cvtdq2ps %xmm0,%xmm5
- .byte 15,40,196 // movaps %xmm4,%xmm0
- .byte 15,40,225 // movaps %xmm1,%xmm4
+ .byte 139,49 // mov (%ecx),%esi
+ .byte 15,133,224,0,0,0 // jne 1d70 <_sk_srcover_rgba_8888_sse2+0x119>
+ .byte 243,15,111,20,178 // movdqu (%edx,%esi,4),%xmm2
+ .byte 102,15,111,167,210,84,0,0 // movdqa 0x54d2(%edi),%xmm4
+ .byte 102,15,111,234 // movdqa %xmm2,%xmm5
+ .byte 102,15,219,236 // pand %xmm4,%xmm5
+ .byte 102,15,111,242 // movdqa %xmm2,%xmm6
+ .byte 102,15,114,214,8 // psrld $0x8,%xmm6
+ .byte 102,15,219,244 // pand %xmm4,%xmm6
+ .byte 102,15,111,250 // movdqa %xmm2,%xmm7
+ .byte 102,15,114,215,16 // psrld $0x10,%xmm7
+ .byte 102,15,219,252 // pand %xmm4,%xmm7
+ .byte 15,91,229 // cvtdq2ps %xmm5,%xmm4
+ .byte 15,41,97,16 // movaps %xmm4,0x10(%ecx)
+ .byte 15,40,175,226,84,0,0 // movaps 0x54e2(%edi),%xmm5
+ .byte 15,92,235 // subps %xmm3,%xmm5
+ .byte 15,40,143,242,84,0,0 // movaps 0x54f2(%edi),%xmm1
+ .byte 15,89,193 // mulps %xmm1,%xmm0
+ .byte 15,89,229 // mulps %xmm5,%xmm4
+ .byte 15,88,224 // addps %xmm0,%xmm4
+ .byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
+ .byte 15,41,113,32 // movaps %xmm6,0x20(%ecx)
+ .byte 15,40,69,216 // movaps -0x28(%ebp),%xmm0
+ .byte 15,89,193 // mulps %xmm1,%xmm0
.byte 15,89,245 // mulps %xmm5,%xmm6
- .byte 15,88,243 // addps %xmm3,%xmm6
- .byte 102,15,91,204 // cvtps2dq %xmm4,%xmm1
+ .byte 15,88,240 // addps %xmm0,%xmm6
+ .byte 15,91,255 // cvtdq2ps %xmm7,%xmm7
+ .byte 15,41,121,48 // movaps %xmm7,0x30(%ecx)
+ .byte 15,40,69,200 // movaps -0x38(%ebp),%xmm0
+ .byte 15,89,193 // mulps %xmm1,%xmm0
+ .byte 15,89,253 // mulps %xmm5,%xmm7
+ .byte 15,88,248 // addps %xmm0,%xmm7
+ .byte 102,15,114,210,24 // psrld $0x18,%xmm2
+ .byte 15,91,194 // cvtdq2ps %xmm2,%xmm0
+ .byte 15,41,65,64 // movaps %xmm0,0x40(%ecx)
+ .byte 15,89,217 // mulps %xmm1,%xmm3
+ .byte 15,89,232 // mulps %xmm0,%xmm5
+ .byte 15,88,235 // addps %xmm3,%xmm5
+ .byte 102,15,91,196 // cvtps2dq %xmm4,%xmm0
+ .byte 102,15,91,206 // cvtps2dq %xmm6,%xmm1
.byte 102,15,114,241,8 // pslld $0x8,%xmm1
- .byte 102,15,91,208 // cvtps2dq %xmm0,%xmm2
- .byte 102,15,235,202 // por %xmm2,%xmm1
+ .byte 102,15,235,200 // por %xmm0,%xmm1
.byte 102,15,91,215 // cvtps2dq %xmm7,%xmm2
.byte 102,15,114,242,16 // pslld $0x10,%xmm2
- .byte 102,15,91,222 // cvtps2dq %xmm6,%xmm3
- .byte 102,15,114,243,24 // pslld $0x18,%xmm3
- .byte 102,15,235,218 // por %xmm2,%xmm3
- .byte 102,15,235,217 // por %xmm1,%xmm3
- .byte 139,125,8 // mov 0x8(%ebp),%edi
+ .byte 102,15,91,197 // cvtps2dq %xmm5,%xmm0
+ .byte 102,15,114,240,24 // pslld $0x18,%xmm0
+ .byte 102,15,235,194 // por %xmm2,%xmm0
+ .byte 102,15,235,193 // por %xmm1,%xmm0
.byte 133,219 // test %ebx,%ebx
- .byte 15,133,141,0,0,0 // jne 25b0 <_sk_srcover_rgba_8888_sse2+0x1ae>
- .byte 243,15,127,28,150 // movdqu %xmm3,(%esi,%edx,4)
- .byte 141,112,8 // lea 0x8(%eax),%esi
- .byte 15,41,108,36,80 // movaps %xmm5,0x50(%esp)
- .byte 15,40,77,168 // movaps -0x58(%ebp),%xmm1
- .byte 15,41,76,36,64 // movaps %xmm1,0x40(%esp)
- .byte 15,40,77,184 // movaps -0x48(%ebp),%xmm1
- .byte 15,41,76,36,48 // movaps %xmm1,0x30(%esp)
- .byte 15,40,77,200 // movaps -0x38(%ebp),%xmm1
- .byte 15,41,76,36,32 // movaps %xmm1,0x20(%esp)
- .byte 137,92,36,16 // mov %ebx,0x10(%esp)
- .byte 137,76,36,12 // mov %ecx,0xc(%esp)
- .byte 137,84,36,8 // mov %edx,0x8(%esp)
- .byte 137,116,36,4 // mov %esi,0x4(%esp)
- .byte 137,60,36 // mov %edi,(%esp)
- .byte 15,40,204 // movaps %xmm4,%xmm1
+ .byte 117,95 // jne 1dab <_sk_srcover_rgba_8888_sse2+0x154>
+ .byte 243,15,127,4,178 // movdqu %xmm0,(%edx,%esi,4)
+ .byte 141,80,8 // lea 0x8(%eax),%edx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 15,40,196 // movaps %xmm4,%xmm0
+ .byte 15,40,206 // movaps %xmm6,%xmm1
.byte 15,40,215 // movaps %xmm7,%xmm2
- .byte 15,40,222 // movaps %xmm6,%xmm3
+ .byte 15,40,221 // movaps %xmm5,%xmm3
+ .byte 82 // push %edx
+ .byte 81 // push %ecx
.byte 255,80,4 // call *0x4(%eax)
- .byte 129,196,188,0,0,0 // add $0xbc,%esp
+ .byte 131,196,60 // add $0x3c,%esp
.byte 94 // pop %esi
.byte 95 // pop %edi
.byte 91 // pop %ebx
.byte 93 // pop %ebp
.byte 195 // ret
- .byte 137,217 // mov %ebx,%ecx
- .byte 136,77,216 // mov %cl,-0x28(%ebp)
- .byte 128,101,216,3 // andb $0x3,-0x28(%ebp)
- .byte 128,125,216,1 // cmpb $0x1,-0x28(%ebp)
- .byte 116,99 // je 25e7 <_sk_srcover_rgba_8888_sse2+0x1e5>
- .byte 102,15,239,192 // pxor %xmm0,%xmm0
- .byte 128,125,216,2 // cmpb $0x2,-0x28(%ebp)
- .byte 139,77,20 // mov 0x14(%ebp),%ecx
- .byte 116,21 // je 25a6 <_sk_srcover_rgba_8888_sse2+0x1a4>
- .byte 128,125,216,3 // cmpb $0x3,-0x28(%ebp)
- .byte 15,133,176,254,255,255 // jne 244b <_sk_srcover_rgba_8888_sse2+0x49>
- .byte 102,15,110,68,150,8 // movd 0x8(%esi,%edx,4),%xmm0
- .byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0
- .byte 102,15,18,4,150 // movlpd (%esi,%edx,4),%xmm0
- .byte 233,155,254,255,255 // jmp 244b <_sk_srcover_rgba_8888_sse2+0x49>
.byte 137,216 // mov %ebx,%eax
- .byte 136,69,216 // mov %al,-0x28(%ebp)
- .byte 128,101,216,3 // andb $0x3,-0x28(%ebp)
- .byte 128,125,216,1 // cmpb $0x1,-0x28(%ebp)
- .byte 116,53 // je 25f4 <_sk_srcover_rgba_8888_sse2+0x1f2>
- .byte 128,125,216,2 // cmpb $0x2,-0x28(%ebp)
+ .byte 136,69,243 // mov %al,-0xd(%ebp)
+ .byte 128,101,243,3 // andb $0x3,-0xd(%ebp)
+ .byte 128,125,243,1 // cmpb $0x1,-0xd(%ebp)
+ .byte 116,80 // je 1dcf <_sk_srcover_rgba_8888_sse2+0x178>
+ .byte 102,15,239,210 // pxor %xmm2,%xmm2
+ .byte 128,125,243,2 // cmpb $0x2,-0xd(%ebp)
.byte 139,69,12 // mov 0xc(%ebp),%eax
- .byte 116,21 // je 25dd <_sk_srcover_rgba_8888_sse2+0x1db>
- .byte 128,125,216,3 // cmpb $0x3,-0x28(%ebp)
- .byte 15,133,86,255,255,255 // jne 2528 <_sk_srcover_rgba_8888_sse2+0x126>
- .byte 102,15,112,203,78 // pshufd $0x4e,%xmm3,%xmm1
- .byte 102,15,126,76,150,8 // movd %xmm1,0x8(%esi,%edx,4)
- .byte 102,15,214,28,150 // movq %xmm3,(%esi,%edx,4)
- .byte 233,65,255,255,255 // jmp 2528 <_sk_srcover_rgba_8888_sse2+0x126>
- .byte 102,15,110,4,150 // movd (%esi,%edx,4),%xmm0
- .byte 139,77,20 // mov 0x14(%ebp),%ecx
- .byte 233,87,254,255,255 // jmp 244b <_sk_srcover_rgba_8888_sse2+0x49>
- .byte 102,15,126,28,150 // movd %xmm3,(%esi,%edx,4)
+ .byte 116,21 // je 1da1 <_sk_srcover_rgba_8888_sse2+0x14a>
+ .byte 128,125,243,3 // cmpb $0x3,-0xd(%ebp)
+ .byte 15,133,255,254,255,255 // jne 1c95 <_sk_srcover_rgba_8888_sse2+0x3e>
+ .byte 102,15,110,84,178,8 // movd 0x8(%edx,%esi,4),%xmm2
+ .byte 102,15,112,210,69 // pshufd $0x45,%xmm2,%xmm2
+ .byte 102,15,18,20,178 // movlpd (%edx,%esi,4),%xmm2
+ .byte 233,234,254,255,255 // jmp 1c95 <_sk_srcover_rgba_8888_sse2+0x3e>
+ .byte 128,227,3 // and $0x3,%bl
+ .byte 128,251,1 // cmp $0x1,%bl
+ .byte 116,41 // je 1ddc <_sk_srcover_rgba_8888_sse2+0x185>
+ .byte 128,251,2 // cmp $0x2,%bl
+ .byte 116,16 // je 1dc8 <_sk_srcover_rgba_8888_sse2+0x171>
+ .byte 128,251,3 // cmp $0x3,%bl
+ .byte 117,148 // jne 1d51 <_sk_srcover_rgba_8888_sse2+0xfa>
+ .byte 102,15,112,200,78 // pshufd $0x4e,%xmm0,%xmm1
+ .byte 102,15,126,76,178,8 // movd %xmm1,0x8(%edx,%esi,4)
+ .byte 102,15,214,4,178 // movq %xmm0,(%edx,%esi,4)
+ .byte 235,130 // jmp 1d51 <_sk_srcover_rgba_8888_sse2+0xfa>
+ .byte 102,15,110,20,178 // movd (%edx,%esi,4),%xmm2
.byte 139,69,12 // mov 0xc(%ebp),%eax
- .byte 233,39,255,255,255 // jmp 2528 <_sk_srcover_rgba_8888_sse2+0x126>
+ .byte 233,185,254,255,255 // jmp 1c95 <_sk_srcover_rgba_8888_sse2+0x3e>
+ .byte 102,15,126,4,178 // movd %xmm0,(%edx,%esi,4)
+ .byte 233,107,255,255,255 // jmp 1d51 <_sk_srcover_rgba_8888_sse2+0xfa>
HIDDEN _sk_clamp_0_sse2
.globl _sk_clamp_0_sse2
@@ -51818,39 +51192,19 @@ FUNCTION(_sk_clamp_0_sse2)
_sk_clamp_0_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
- .byte 139,85,20 // mov 0x14(%ebp),%edx
- .byte 139,117,24 // mov 0x18(%ebp),%esi
- .byte 15,40,101,40 // movaps 0x28(%ebp),%xmm4
- .byte 15,40,109,56 // movaps 0x38(%ebp),%xmm5
- .byte 15,40,117,72 // movaps 0x48(%ebp),%xmm6
- .byte 15,87,255 // xorps %xmm7,%xmm7
- .byte 15,95,199 // maxps %xmm7,%xmm0
- .byte 15,95,207 // maxps %xmm7,%xmm1
- .byte 15,95,215 // maxps %xmm7,%xmm2
- .byte 15,95,223 // maxps %xmm7,%xmm3
- .byte 15,40,125,88 // movaps 0x58(%ebp),%xmm7
- .byte 139,125,12 // mov 0xc(%ebp),%edi
- .byte 141,95,4 // lea 0x4(%edi),%ebx
- .byte 15,41,124,36,80 // movaps %xmm7,0x50(%esp)
- .byte 15,41,116,36,64 // movaps %xmm6,0x40(%esp)
- .byte 15,41,108,36,48 // movaps %xmm5,0x30(%esp)
- .byte 15,41,100,36,32 // movaps %xmm4,0x20(%esp)
- .byte 137,116,36,16 // mov %esi,0x10(%esp)
- .byte 137,84,36,12 // mov %edx,0xc(%esp)
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
- .byte 255,23 // call *(%edi)
- .byte 131,196,108 // add $0x6c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 139,69,12 // mov 0xc(%ebp),%eax
+ .byte 15,87,228 // xorps %xmm4,%xmm4
+ .byte 15,95,196 // maxps %xmm4,%xmm0
+ .byte 15,95,204 // maxps %xmm4,%xmm1
+ .byte 15,95,212 // maxps %xmm4,%xmm2
+ .byte 15,95,220 // maxps %xmm4,%xmm3
+ .byte 141,72,4 // lea 0x4(%eax),%ecx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 81 // push %ecx
+ .byte 255,117,8 // pushl 0x8(%ebp)
+ .byte 255,16 // call *(%eax)
+ .byte 131,196,24 // add $0x18,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -51860,41 +51214,21 @@ FUNCTION(_sk_clamp_1_sse2)
_sk_clamp_1_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 232,0,0,0,0 // call 267a <_sk_clamp_1_sse2+0xe>
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 232,0,0,0,0 // call 1e1a <_sk_clamp_1_sse2+0xb>
.byte 88 // pop %eax
- .byte 139,77,8 // mov 0x8(%ebp),%ecx
- .byte 139,85,16 // mov 0x10(%ebp),%edx
- .byte 139,117,20 // mov 0x14(%ebp),%esi
- .byte 139,125,24 // mov 0x18(%ebp),%edi
- .byte 15,40,101,40 // movaps 0x28(%ebp),%xmm4
- .byte 15,40,109,56 // movaps 0x38(%ebp),%xmm5
- .byte 15,40,117,72 // movaps 0x48(%ebp),%xmm6
- .byte 15,40,184,230,109,0,0 // movaps 0x6de6(%eax),%xmm7
- .byte 15,93,199 // minps %xmm7,%xmm0
- .byte 15,93,207 // minps %xmm7,%xmm1
- .byte 15,93,215 // minps %xmm7,%xmm2
- .byte 15,93,223 // minps %xmm7,%xmm3
- .byte 15,40,125,88 // movaps 0x58(%ebp),%xmm7
- .byte 139,69,12 // mov 0xc(%ebp),%eax
- .byte 141,88,4 // lea 0x4(%eax),%ebx
- .byte 15,41,124,36,80 // movaps %xmm7,0x50(%esp)
- .byte 15,41,116,36,64 // movaps %xmm6,0x40(%esp)
- .byte 15,41,108,36,48 // movaps %xmm5,0x30(%esp)
- .byte 15,41,100,36,32 // movaps %xmm4,0x20(%esp)
- .byte 137,124,36,16 // mov %edi,0x10(%esp)
- .byte 137,116,36,12 // mov %esi,0xc(%esp)
- .byte 137,84,36,8 // mov %edx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,12,36 // mov %ecx,(%esp)
- .byte 255,16 // call *(%eax)
- .byte 131,196,108 // add $0x6c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 139,77,12 // mov 0xc(%ebp),%ecx
+ .byte 15,40,160,86,83,0,0 // movaps 0x5356(%eax),%xmm4
+ .byte 15,93,196 // minps %xmm4,%xmm0
+ .byte 15,93,204 // minps %xmm4,%xmm1
+ .byte 15,93,212 // minps %xmm4,%xmm2
+ .byte 15,93,220 // minps %xmm4,%xmm3
+ .byte 141,65,4 // lea 0x4(%ecx),%eax
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 80 // push %eax
+ .byte 255,117,8 // pushl 0x8(%ebp)
+ .byte 255,17 // call *(%ecx)
+ .byte 131,196,24 // add $0x18,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -51904,40 +51238,20 @@ FUNCTION(_sk_clamp_a_sse2)
_sk_clamp_a_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 232,0,0,0,0 // call 26ef <_sk_clamp_a_sse2+0xe>
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 232,0,0,0,0 // call 1e4d <_sk_clamp_a_sse2+0xb>
.byte 88 // pop %eax
- .byte 139,77,8 // mov 0x8(%ebp),%ecx
- .byte 139,85,16 // mov 0x10(%ebp),%edx
- .byte 139,117,20 // mov 0x14(%ebp),%esi
- .byte 139,125,24 // mov 0x18(%ebp),%edi
- .byte 15,40,101,40 // movaps 0x28(%ebp),%xmm4
- .byte 15,40,109,56 // movaps 0x38(%ebp),%xmm5
- .byte 15,40,117,72 // movaps 0x48(%ebp),%xmm6
- .byte 15,40,125,88 // movaps 0x58(%ebp),%xmm7
- .byte 15,93,152,129,109,0,0 // minps 0x6d81(%eax),%xmm3
- .byte 139,69,12 // mov 0xc(%ebp),%eax
+ .byte 139,77,12 // mov 0xc(%ebp),%ecx
+ .byte 15,93,152,51,83,0,0 // minps 0x5333(%eax),%xmm3
.byte 15,93,195 // minps %xmm3,%xmm0
.byte 15,93,203 // minps %xmm3,%xmm1
.byte 15,93,211 // minps %xmm3,%xmm2
- .byte 141,88,4 // lea 0x4(%eax),%ebx
- .byte 15,41,124,36,80 // movaps %xmm7,0x50(%esp)
- .byte 15,41,116,36,64 // movaps %xmm6,0x40(%esp)
- .byte 15,41,108,36,48 // movaps %xmm5,0x30(%esp)
- .byte 15,41,100,36,32 // movaps %xmm4,0x20(%esp)
- .byte 137,124,36,16 // mov %edi,0x10(%esp)
- .byte 137,116,36,12 // mov %esi,0xc(%esp)
- .byte 137,84,36,8 // mov %edx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,12,36 // mov %ecx,(%esp)
- .byte 255,16 // call *(%eax)
- .byte 131,196,108 // add $0x6c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 141,65,4 // lea 0x4(%ecx),%eax
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 80 // push %eax
+ .byte 255,117,8 // pushl 0x8(%ebp)
+ .byte 255,17 // call *(%ecx)
+ .byte 131,196,24 // add $0x18,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -51947,40 +51261,29 @@ FUNCTION(_sk_clamp_a_dst_sse2)
_sk_clamp_a_dst_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 232,0,0,0,0 // call 2761 <_sk_clamp_a_dst_sse2+0xe>
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 232,0,0,0,0 // call 1e7d <_sk_clamp_a_dst_sse2+0xb>
.byte 88 // pop %eax
- .byte 139,77,8 // mov 0x8(%ebp),%ecx
- .byte 139,85,16 // mov 0x10(%ebp),%edx
- .byte 139,117,20 // mov 0x14(%ebp),%esi
- .byte 139,125,24 // mov 0x18(%ebp),%edi
- .byte 15,40,101,88 // movaps 0x58(%ebp),%xmm4
- .byte 15,93,160,31,109,0,0 // minps 0x6d1f(%eax),%xmm4
- .byte 139,69,12 // mov 0xc(%ebp),%eax
- .byte 15,40,109,72 // movaps 0x48(%ebp),%xmm5
- .byte 15,40,117,56 // movaps 0x38(%ebp),%xmm6
- .byte 15,40,125,40 // movaps 0x28(%ebp),%xmm7
- .byte 15,93,252 // minps %xmm4,%xmm7
- .byte 15,93,244 // minps %xmm4,%xmm6
+ .byte 139,77,12 // mov 0xc(%ebp),%ecx
+ .byte 139,85,8 // mov 0x8(%ebp),%edx
+ .byte 15,40,98,64 // movaps 0x40(%edx),%xmm4
+ .byte 15,93,160,19,83,0,0 // minps 0x5313(%eax),%xmm4
+ .byte 15,41,98,64 // movaps %xmm4,0x40(%edx)
+ .byte 15,40,106,16 // movaps 0x10(%edx),%xmm5
.byte 15,93,236 // minps %xmm4,%xmm5
- .byte 141,88,4 // lea 0x4(%eax),%ebx
- .byte 15,41,100,36,80 // movaps %xmm4,0x50(%esp)
- .byte 137,124,36,16 // mov %edi,0x10(%esp)
- .byte 137,116,36,12 // mov %esi,0xc(%esp)
- .byte 137,84,36,8 // mov %edx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,12,36 // mov %ecx,(%esp)
- .byte 15,41,108,36,64 // movaps %xmm5,0x40(%esp)
- .byte 15,41,116,36,48 // movaps %xmm6,0x30(%esp)
- .byte 15,41,124,36,32 // movaps %xmm7,0x20(%esp)
- .byte 255,16 // call *(%eax)
- .byte 131,196,108 // add $0x6c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 15,41,106,16 // movaps %xmm5,0x10(%edx)
+ .byte 15,40,106,32 // movaps 0x20(%edx),%xmm5
+ .byte 15,93,236 // minps %xmm4,%xmm5
+ .byte 15,41,106,32 // movaps %xmm5,0x20(%edx)
+ .byte 15,40,106,48 // movaps 0x30(%edx),%xmm5
+ .byte 15,93,236 // minps %xmm4,%xmm5
+ .byte 15,41,106,48 // movaps %xmm5,0x30(%edx)
+ .byte 141,65,4 // lea 0x4(%ecx),%eax
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 80 // push %eax
+ .byte 82 // push %edx
+ .byte 255,17 // call *(%ecx)
+ .byte 131,196,24 // add $0x18,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -51990,41 +51293,21 @@ FUNCTION(_sk_set_rgb_sse2)
_sk_set_rgb_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
- .byte 139,85,20 // mov 0x14(%ebp),%edx
- .byte 139,117,12 // mov 0xc(%ebp),%esi
- .byte 139,62 // mov (%esi),%edi
- .byte 243,15,16,7 // movss (%edi),%xmm0
- .byte 243,15,16,79,4 // movss 0x4(%edi),%xmm1
- .byte 243,15,16,87,8 // movss 0x8(%edi),%xmm2
- .byte 139,125,24 // mov 0x18(%ebp),%edi
- .byte 15,40,101,40 // movaps 0x28(%ebp),%xmm4
- .byte 15,40,109,56 // movaps 0x38(%ebp),%xmm5
- .byte 15,40,117,72 // movaps 0x48(%ebp),%xmm6
- .byte 15,40,125,88 // movaps 0x58(%ebp),%xmm7
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 139,69,12 // mov 0xc(%ebp),%eax
+ .byte 139,8 // mov (%eax),%ecx
+ .byte 243,15,16,1 // movss (%ecx),%xmm0
+ .byte 243,15,16,73,4 // movss 0x4(%ecx),%xmm1
.byte 15,198,192,0 // shufps $0x0,%xmm0,%xmm0
.byte 15,198,201,0 // shufps $0x0,%xmm1,%xmm1
+ .byte 243,15,16,81,8 // movss 0x8(%ecx),%xmm2
.byte 15,198,210,0 // shufps $0x0,%xmm2,%xmm2
- .byte 141,94,8 // lea 0x8(%esi),%ebx
- .byte 15,41,124,36,80 // movaps %xmm7,0x50(%esp)
- .byte 15,41,116,36,64 // movaps %xmm6,0x40(%esp)
- .byte 15,41,108,36,48 // movaps %xmm5,0x30(%esp)
- .byte 15,41,100,36,32 // movaps %xmm4,0x20(%esp)
- .byte 137,124,36,16 // mov %edi,0x10(%esp)
- .byte 137,84,36,12 // mov %edx,0xc(%esp)
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
- .byte 255,86,4 // call *0x4(%esi)
- .byte 131,196,108 // add $0x6c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 141,72,8 // lea 0x8(%eax),%ecx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 81 // push %ecx
+ .byte 255,117,8 // pushl 0x8(%ebp)
+ .byte 255,80,4 // call *0x4(%eax)
+ .byte 131,196,24 // add $0x18,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -52034,37 +51317,17 @@ FUNCTION(_sk_swap_rb_sse2)
_sk_swap_rb_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
+ .byte 131,236,8 // sub $0x8,%esp
.byte 15,40,224 // movaps %xmm0,%xmm4
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
- .byte 139,85,20 // mov 0x14(%ebp),%edx
- .byte 139,117,24 // mov 0x18(%ebp),%esi
- .byte 15,40,69,40 // movaps 0x28(%ebp),%xmm0
- .byte 15,40,109,56 // movaps 0x38(%ebp),%xmm5
- .byte 15,40,117,72 // movaps 0x48(%ebp),%xmm6
- .byte 15,40,125,88 // movaps 0x58(%ebp),%xmm7
- .byte 139,125,12 // mov 0xc(%ebp),%edi
- .byte 141,95,4 // lea 0x4(%edi),%ebx
- .byte 15,41,124,36,80 // movaps %xmm7,0x50(%esp)
- .byte 15,41,116,36,64 // movaps %xmm6,0x40(%esp)
- .byte 15,41,108,36,48 // movaps %xmm5,0x30(%esp)
- .byte 15,41,68,36,32 // movaps %xmm0,0x20(%esp)
- .byte 137,116,36,16 // mov %esi,0x10(%esp)
- .byte 137,84,36,12 // mov %edx,0xc(%esp)
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
+ .byte 139,69,12 // mov 0xc(%ebp),%eax
+ .byte 141,72,4 // lea 0x4(%eax),%ecx
+ .byte 131,236,8 // sub $0x8,%esp
.byte 15,40,194 // movaps %xmm2,%xmm0
.byte 15,40,212 // movaps %xmm4,%xmm2
- .byte 255,23 // call *(%edi)
- .byte 131,196,108 // add $0x6c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 81 // push %ecx
+ .byte 255,117,8 // pushl 0x8(%ebp)
+ .byte 255,16 // call *(%eax)
+ .byte 131,196,24 // add $0x18,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -52074,30 +51337,19 @@ FUNCTION(_sk_move_src_dst_sse2)
_sk_move_src_dst_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
- .byte 139,85,20 // mov 0x14(%ebp),%edx
- .byte 139,117,24 // mov 0x18(%ebp),%esi
- .byte 139,125,12 // mov 0xc(%ebp),%edi
- .byte 141,95,4 // lea 0x4(%edi),%ebx
- .byte 15,41,92,36,80 // movaps %xmm3,0x50(%esp)
- .byte 15,41,84,36,64 // movaps %xmm2,0x40(%esp)
- .byte 15,41,76,36,48 // movaps %xmm1,0x30(%esp)
- .byte 15,41,68,36,32 // movaps %xmm0,0x20(%esp)
- .byte 137,116,36,16 // mov %esi,0x10(%esp)
- .byte 137,84,36,12 // mov %edx,0xc(%esp)
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
- .byte 255,23 // call *(%edi)
- .byte 131,196,108 // add $0x6c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 139,69,12 // mov 0xc(%ebp),%eax
+ .byte 139,77,8 // mov 0x8(%ebp),%ecx
+ .byte 15,41,65,16 // movaps %xmm0,0x10(%ecx)
+ .byte 15,41,73,32 // movaps %xmm1,0x20(%ecx)
+ .byte 15,41,81,48 // movaps %xmm2,0x30(%ecx)
+ .byte 15,41,89,64 // movaps %xmm3,0x40(%ecx)
+ .byte 141,80,4 // lea 0x4(%eax),%edx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 82 // push %edx
+ .byte 81 // push %ecx
+ .byte 255,16 // call *(%eax)
+ .byte 131,196,24 // add $0x18,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -52107,34 +51359,19 @@ FUNCTION(_sk_move_dst_src_sse2)
_sk_move_dst_src_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
- .byte 139,85,20 // mov 0x14(%ebp),%edx
- .byte 139,117,24 // mov 0x18(%ebp),%esi
- .byte 15,40,69,40 // movaps 0x28(%ebp),%xmm0
- .byte 15,40,77,56 // movaps 0x38(%ebp),%xmm1
- .byte 15,40,85,72 // movaps 0x48(%ebp),%xmm2
- .byte 15,40,93,88 // movaps 0x58(%ebp),%xmm3
- .byte 139,125,12 // mov 0xc(%ebp),%edi
- .byte 141,95,4 // lea 0x4(%edi),%ebx
- .byte 15,41,92,36,80 // movaps %xmm3,0x50(%esp)
- .byte 15,41,84,36,64 // movaps %xmm2,0x40(%esp)
- .byte 15,41,76,36,48 // movaps %xmm1,0x30(%esp)
- .byte 15,41,68,36,32 // movaps %xmm0,0x20(%esp)
- .byte 137,116,36,16 // mov %esi,0x10(%esp)
- .byte 137,84,36,12 // mov %edx,0xc(%esp)
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
- .byte 255,23 // call *(%edi)
- .byte 131,196,108 // add $0x6c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 139,69,12 // mov 0xc(%ebp),%eax
+ .byte 139,77,8 // mov 0x8(%ebp),%ecx
+ .byte 15,40,65,16 // movaps 0x10(%ecx),%xmm0
+ .byte 15,40,73,32 // movaps 0x20(%ecx),%xmm1
+ .byte 15,40,81,48 // movaps 0x30(%ecx),%xmm2
+ .byte 15,40,89,64 // movaps 0x40(%ecx),%xmm3
+ .byte 141,80,4 // lea 0x4(%eax),%edx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 82 // push %edx
+ .byte 81 // push %ecx
+ .byte 255,16 // call *(%eax)
+ .byte 131,196,24 // add $0x18,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -52144,37 +51381,17 @@ FUNCTION(_sk_premul_sse2)
_sk_premul_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
- .byte 139,85,20 // mov 0x14(%ebp),%edx
- .byte 139,117,24 // mov 0x18(%ebp),%esi
- .byte 15,40,101,40 // movaps 0x28(%ebp),%xmm4
- .byte 15,40,109,56 // movaps 0x38(%ebp),%xmm5
- .byte 15,40,117,72 // movaps 0x48(%ebp),%xmm6
- .byte 15,40,125,88 // movaps 0x58(%ebp),%xmm7
- .byte 139,125,12 // mov 0xc(%ebp),%edi
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 15,89,195 // mulps %xmm3,%xmm0
.byte 15,89,203 // mulps %xmm3,%xmm1
.byte 15,89,211 // mulps %xmm3,%xmm2
- .byte 141,95,4 // lea 0x4(%edi),%ebx
- .byte 15,41,124,36,80 // movaps %xmm7,0x50(%esp)
- .byte 15,41,116,36,64 // movaps %xmm6,0x40(%esp)
- .byte 15,41,108,36,48 // movaps %xmm5,0x30(%esp)
- .byte 15,41,100,36,32 // movaps %xmm4,0x20(%esp)
- .byte 137,116,36,16 // mov %esi,0x10(%esp)
- .byte 137,84,36,12 // mov %edx,0xc(%esp)
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
- .byte 255,23 // call *(%edi)
- .byte 131,196,108 // add $0x6c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 141,72,4 // lea 0x4(%eax),%ecx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 81 // push %ecx
+ .byte 255,117,8 // pushl 0x8(%ebp)
+ .byte 255,16 // call *(%eax)
+ .byte 131,196,24 // add $0x18,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -52184,36 +51401,24 @@ FUNCTION(_sk_premul_dst_sse2)
_sk_premul_dst_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
- .byte 139,85,20 // mov 0x14(%ebp),%edx
- .byte 139,117,24 // mov 0x18(%ebp),%esi
- .byte 139,125,12 // mov 0xc(%ebp),%edi
- .byte 15,40,101,88 // movaps 0x58(%ebp),%xmm4
- .byte 15,40,109,40 // movaps 0x28(%ebp),%xmm5
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 139,69,12 // mov 0xc(%ebp),%eax
+ .byte 139,77,8 // mov 0x8(%ebp),%ecx
+ .byte 15,40,97,64 // movaps 0x40(%ecx),%xmm4
+ .byte 15,40,105,16 // movaps 0x10(%ecx),%xmm5
.byte 15,89,236 // mulps %xmm4,%xmm5
- .byte 15,40,117,56 // movaps 0x38(%ebp),%xmm6
- .byte 15,89,244 // mulps %xmm4,%xmm6
- .byte 141,95,4 // lea 0x4(%edi),%ebx
- .byte 15,41,100,36,80 // movaps %xmm4,0x50(%esp)
- .byte 15,89,101,72 // mulps 0x48(%ebp),%xmm4
- .byte 15,41,100,36,64 // movaps %xmm4,0x40(%esp)
- .byte 15,41,116,36,48 // movaps %xmm6,0x30(%esp)
- .byte 15,41,108,36,32 // movaps %xmm5,0x20(%esp)
- .byte 137,116,36,16 // mov %esi,0x10(%esp)
- .byte 137,84,36,12 // mov %edx,0xc(%esp)
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
- .byte 255,23 // call *(%edi)
- .byte 131,196,108 // add $0x6c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 15,41,105,16 // movaps %xmm5,0x10(%ecx)
+ .byte 15,40,105,32 // movaps 0x20(%ecx),%xmm5
+ .byte 15,89,236 // mulps %xmm4,%xmm5
+ .byte 15,41,105,32 // movaps %xmm5,0x20(%ecx)
+ .byte 15,89,97,48 // mulps 0x30(%ecx),%xmm4
+ .byte 15,41,97,48 // movaps %xmm4,0x30(%ecx)
+ .byte 141,80,4 // lea 0x4(%eax),%edx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 82 // push %edx
+ .byte 81 // push %ecx
+ .byte 255,16 // call *(%eax)
+ .byte 131,196,24 // add $0x18,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -52223,44 +51428,24 @@ FUNCTION(_sk_unpremul_sse2)
_sk_unpremul_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 232,0,0,0,0 // call 2a20 <_sk_unpremul_sse2+0xe>
- .byte 89 // pop %ecx
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,85,16 // mov 0x10(%ebp),%edx
- .byte 139,117,20 // mov 0x14(%ebp),%esi
- .byte 139,125,24 // mov 0x18(%ebp),%edi
- .byte 15,40,101,40 // movaps 0x28(%ebp),%xmm4
- .byte 15,40,109,56 // movaps 0x38(%ebp),%xmm5
- .byte 15,87,246 // xorps %xmm6,%xmm6
- .byte 15,40,185,112,106,0,0 // movaps 0x6a70(%ecx),%xmm7
- .byte 15,94,251 // divps %xmm3,%xmm7
- .byte 15,194,243,4 // cmpneqps %xmm3,%xmm6
- .byte 15,84,247 // andps %xmm7,%xmm6
- .byte 15,40,125,72 // movaps 0x48(%ebp),%xmm7
- .byte 15,89,198 // mulps %xmm6,%xmm0
- .byte 15,89,206 // mulps %xmm6,%xmm1
- .byte 15,89,214 // mulps %xmm6,%xmm2
- .byte 15,40,117,88 // movaps 0x58(%ebp),%xmm6
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 232,0,0,0,0 // call 1fde <_sk_unpremul_sse2+0xb>
+ .byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
- .byte 141,89,4 // lea 0x4(%ecx),%ebx
- .byte 15,41,116,36,80 // movaps %xmm6,0x50(%esp)
- .byte 15,41,124,36,64 // movaps %xmm7,0x40(%esp)
- .byte 15,41,108,36,48 // movaps %xmm5,0x30(%esp)
- .byte 15,41,100,36,32 // movaps %xmm4,0x20(%esp)
- .byte 137,124,36,16 // mov %edi,0x10(%esp)
- .byte 137,116,36,12 // mov %esi,0xc(%esp)
- .byte 137,84,36,8 // mov %edx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
+ .byte 15,87,228 // xorps %xmm4,%xmm4
+ .byte 15,40,168,194,81,0,0 // movaps 0x51c2(%eax),%xmm5
+ .byte 15,94,235 // divps %xmm3,%xmm5
+ .byte 15,194,227,4 // cmpneqps %xmm3,%xmm4
+ .byte 15,84,229 // andps %xmm5,%xmm4
+ .byte 15,89,196 // mulps %xmm4,%xmm0
+ .byte 15,89,204 // mulps %xmm4,%xmm1
+ .byte 15,89,212 // mulps %xmm4,%xmm2
+ .byte 141,65,4 // lea 0x4(%ecx),%eax
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 80 // push %eax
+ .byte 255,117,8 // pushl 0x8(%ebp)
.byte 255,17 // call *(%ecx)
- .byte 131,196,108 // add $0x6c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 131,196,24 // add $0x18,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -52270,87 +51455,67 @@ FUNCTION(_sk_from_srgb_sse2)
_sk_from_srgb_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 129,236,156,0,0,0 // sub $0x9c,%esp
- .byte 15,41,93,184 // movaps %xmm3,-0x48(%ebp)
- .byte 15,40,242 // movaps %xmm2,%xmm6
- .byte 15,40,233 // movaps %xmm1,%xmm5
+ .byte 131,236,56 // sub $0x38,%esp
+ .byte 15,41,93,200 // movaps %xmm3,-0x38(%ebp)
+ .byte 15,40,234 // movaps %xmm2,%xmm5
+ .byte 15,40,217 // movaps %xmm1,%xmm3
.byte 15,40,208 // movaps %xmm0,%xmm2
- .byte 232,0,0,0,0 // call 2aaf <_sk_from_srgb_sse2+0x1e>
+ .byte 232,0,0,0,0 // call 2028 <_sk_from_srgb_sse2+0x18>
.byte 88 // pop %eax
- .byte 15,40,218 // movaps %xmm2,%xmm3
- .byte 15,89,219 // mulps %xmm3,%xmm3
- .byte 15,40,160,1,106,0,0 // movaps 0x6a01(%eax),%xmm4
+ .byte 15,40,202 // movaps %xmm2,%xmm1
+ .byte 15,89,201 // mulps %xmm1,%xmm1
+ .byte 15,40,160,152,81,0,0 // movaps 0x5198(%eax),%xmm4
.byte 15,89,196 // mulps %xmm4,%xmm0
- .byte 15,40,136,17,106,0,0 // movaps 0x6a11(%eax),%xmm1
- .byte 15,41,77,200 // movaps %xmm1,-0x38(%ebp)
- .byte 15,88,193 // addps %xmm1,%xmm0
- .byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,40,152,241,105,0,0 // movaps 0x69f1(%eax),%xmm3
+ .byte 15,40,176,168,81,0,0 // movaps 0x51a8(%eax),%xmm6
+ .byte 15,41,117,216 // movaps %xmm6,-0x28(%ebp)
+ .byte 15,88,198 // addps %xmm6,%xmm0
+ .byte 15,89,193 // mulps %xmm1,%xmm0
+ .byte 15,40,176,136,81,0,0 // movaps 0x5188(%eax),%xmm6
.byte 15,40,202 // movaps %xmm2,%xmm1
- .byte 15,89,203 // mulps %xmm3,%xmm1
- .byte 15,40,184,33,106,0,0 // movaps 0x6a21(%eax),%xmm7
- .byte 15,41,125,216 // movaps %xmm7,-0x28(%ebp)
+ .byte 15,89,206 // mulps %xmm6,%xmm1
+ .byte 15,40,184,184,81,0,0 // movaps 0x51b8(%eax),%xmm7
+ .byte 15,41,125,232 // movaps %xmm7,-0x18(%ebp)
.byte 15,88,199 // addps %xmm7,%xmm0
- .byte 15,40,184,49,106,0,0 // movaps 0x6a31(%eax),%xmm7
+ .byte 15,40,184,200,81,0,0 // movaps 0x51c8(%eax),%xmm7
.byte 15,194,215,1 // cmpltps %xmm7,%xmm2
.byte 15,84,202 // andps %xmm2,%xmm1
.byte 15,85,208 // andnps %xmm0,%xmm2
.byte 15,86,209 // orps %xmm1,%xmm2
- .byte 15,40,197 // movaps %xmm5,%xmm0
+ .byte 15,40,195 // movaps %xmm3,%xmm0
.byte 15,89,192 // mulps %xmm0,%xmm0
- .byte 15,40,205 // movaps %xmm5,%xmm1
+ .byte 15,40,203 // movaps %xmm3,%xmm1
.byte 15,89,204 // mulps %xmm4,%xmm1
- .byte 15,88,77,200 // addps -0x38(%ebp),%xmm1
+ .byte 15,88,77,216 // addps -0x28(%ebp),%xmm1
.byte 15,89,200 // mulps %xmm0,%xmm1
+ .byte 15,40,195 // movaps %xmm3,%xmm0
+ .byte 15,89,198 // mulps %xmm6,%xmm0
+ .byte 15,88,77,232 // addps -0x18(%ebp),%xmm1
+ .byte 15,194,223,1 // cmpltps %xmm7,%xmm3
+ .byte 15,84,195 // andps %xmm3,%xmm0
+ .byte 15,85,217 // andnps %xmm1,%xmm3
+ .byte 15,86,216 // orps %xmm0,%xmm3
+ .byte 15,89,229 // mulps %xmm5,%xmm4
+ .byte 15,88,101,216 // addps -0x28(%ebp),%xmm4
.byte 15,40,197 // movaps %xmm5,%xmm0
- .byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,77,216 // addps -0x28(%ebp),%xmm1
- .byte 15,194,239,1 // cmpltps %xmm7,%xmm5
- .byte 15,84,197 // andps %xmm5,%xmm0
- .byte 15,85,233 // andnps %xmm1,%xmm5
- .byte 15,86,232 // orps %xmm0,%xmm5
- .byte 15,89,230 // mulps %xmm6,%xmm4
- .byte 15,88,101,200 // addps -0x38(%ebp),%xmm4
- .byte 15,40,198 // movaps %xmm6,%xmm0
.byte 15,89,192 // mulps %xmm0,%xmm0
.byte 15,89,224 // mulps %xmm0,%xmm4
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
- .byte 139,85,20 // mov 0x14(%ebp),%edx
- .byte 139,117,24 // mov 0x18(%ebp),%esi
- .byte 15,88,101,216 // addps -0x28(%ebp),%xmm4
- .byte 15,40,69,40 // movaps 0x28(%ebp),%xmm0
- .byte 15,89,222 // mulps %xmm6,%xmm3
- .byte 15,194,247,1 // cmpltps %xmm7,%xmm6
- .byte 15,40,77,56 // movaps 0x38(%ebp),%xmm1
- .byte 15,84,222 // andps %xmm6,%xmm3
- .byte 15,85,244 // andnps %xmm4,%xmm6
- .byte 15,40,101,72 // movaps 0x48(%ebp),%xmm4
- .byte 15,86,243 // orps %xmm3,%xmm6
- .byte 15,40,93,88 // movaps 0x58(%ebp),%xmm3
- .byte 139,125,12 // mov 0xc(%ebp),%edi
- .byte 141,95,4 // lea 0x4(%edi),%ebx
- .byte 15,41,92,36,80 // movaps %xmm3,0x50(%esp)
- .byte 15,41,100,36,64 // movaps %xmm4,0x40(%esp)
- .byte 15,41,76,36,48 // movaps %xmm1,0x30(%esp)
- .byte 15,41,68,36,32 // movaps %xmm0,0x20(%esp)
- .byte 137,116,36,16 // mov %esi,0x10(%esp)
- .byte 137,84,36,12 // mov %edx,0xc(%esp)
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
+ .byte 15,88,101,232 // addps -0x18(%ebp),%xmm4
+ .byte 15,89,245 // mulps %xmm5,%xmm6
+ .byte 15,194,239,1 // cmpltps %xmm7,%xmm5
+ .byte 15,84,245 // andps %xmm5,%xmm6
+ .byte 15,85,236 // andnps %xmm4,%xmm5
+ .byte 15,86,238 // orps %xmm6,%xmm5
+ .byte 139,69,12 // mov 0xc(%ebp),%eax
+ .byte 141,72,4 // lea 0x4(%eax),%ecx
+ .byte 131,236,8 // sub $0x8,%esp
.byte 15,40,194 // movaps %xmm2,%xmm0
- .byte 15,40,205 // movaps %xmm5,%xmm1
- .byte 15,40,214 // movaps %xmm6,%xmm2
- .byte 15,40,93,184 // movaps -0x48(%ebp),%xmm3
- .byte 255,23 // call *(%edi)
- .byte 129,196,156,0,0,0 // add $0x9c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 15,40,203 // movaps %xmm3,%xmm1
+ .byte 15,40,213 // movaps %xmm5,%xmm2
+ .byte 15,40,93,200 // movaps -0x38(%ebp),%xmm3
+ .byte 81 // push %ecx
+ .byte 255,117,8 // pushl 0x8(%ebp)
+ .byte 255,16 // call *(%eax)
+ .byte 131,196,72 // add $0x48,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -52360,87 +51525,73 @@ FUNCTION(_sk_from_srgb_dst_sse2)
_sk_from_srgb_dst_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 129,236,188,0,0,0 // sub $0xbc,%esp
- .byte 15,41,93,152 // movaps %xmm3,-0x68(%ebp)
- .byte 15,41,85,168 // movaps %xmm2,-0x58(%ebp)
- .byte 15,41,77,184 // movaps %xmm1,-0x48(%ebp)
- .byte 15,41,69,200 // movaps %xmm0,-0x38(%ebp)
- .byte 232,0,0,0,0 // call 2bd2 <_sk_from_srgb_dst_sse2+0x21>
- .byte 88 // pop %eax
- .byte 15,40,77,40 // movaps 0x28(%ebp),%xmm1
- .byte 15,40,193 // movaps %xmm1,%xmm0
- .byte 15,89,192 // mulps %xmm0,%xmm0
- .byte 15,40,168,46,105,0,0 // movaps 0x692e(%eax),%xmm5
- .byte 15,40,249 // movaps %xmm1,%xmm7
- .byte 15,89,253 // mulps %xmm5,%xmm7
- .byte 15,40,144,62,105,0,0 // movaps 0x693e(%eax),%xmm2
- .byte 15,41,85,216 // movaps %xmm2,-0x28(%ebp)
- .byte 15,88,250 // addps %xmm2,%xmm7
- .byte 15,89,248 // mulps %xmm0,%xmm7
- .byte 15,40,176,30,105,0,0 // movaps 0x691e(%eax),%xmm6
- .byte 15,40,225 // movaps %xmm1,%xmm4
- .byte 15,89,230 // mulps %xmm6,%xmm4
- .byte 15,40,152,78,105,0,0 // movaps 0x694e(%eax),%xmm3
- .byte 15,88,251 // addps %xmm3,%xmm7
- .byte 15,40,144,94,105,0,0 // movaps 0x695e(%eax),%xmm2
- .byte 15,194,202,1 // cmpltps %xmm2,%xmm1
- .byte 15,84,225 // andps %xmm1,%xmm4
- .byte 15,85,207 // andnps %xmm7,%xmm1
- .byte 15,86,204 // orps %xmm4,%xmm1
- .byte 15,40,69,56 // movaps 0x38(%ebp),%xmm0
- .byte 15,40,224 // movaps %xmm0,%xmm4
- .byte 15,89,228 // mulps %xmm4,%xmm4
- .byte 15,40,248 // movaps %xmm0,%xmm7
- .byte 15,89,253 // mulps %xmm5,%xmm7
- .byte 15,88,125,216 // addps -0x28(%ebp),%xmm7
- .byte 15,89,252 // mulps %xmm4,%xmm7
- .byte 15,40,224 // movaps %xmm0,%xmm4
- .byte 15,89,230 // mulps %xmm6,%xmm4
- .byte 15,88,251 // addps %xmm3,%xmm7
- .byte 15,194,194,1 // cmpltps %xmm2,%xmm0
- .byte 15,84,224 // andps %xmm0,%xmm4
- .byte 15,85,199 // andnps %xmm7,%xmm0
- .byte 15,86,196 // orps %xmm4,%xmm0
- .byte 15,40,101,72 // movaps 0x48(%ebp),%xmm4
- .byte 15,89,236 // mulps %xmm4,%xmm5
- .byte 15,88,109,216 // addps -0x28(%ebp),%xmm5
- .byte 15,40,252 // movaps %xmm4,%xmm7
- .byte 15,89,255 // mulps %xmm7,%xmm7
- .byte 15,89,239 // mulps %xmm7,%xmm5
- .byte 15,88,235 // addps %xmm3,%xmm5
- .byte 15,89,244 // mulps %xmm4,%xmm6
- .byte 15,194,226,1 // cmpltps %xmm2,%xmm4
- .byte 15,84,244 // andps %xmm4,%xmm6
- .byte 15,85,229 // andnps %xmm5,%xmm4
+ .byte 131,236,72 // sub $0x48,%esp
+ .byte 15,41,93,184 // movaps %xmm3,-0x48(%ebp)
+ .byte 15,41,85,200 // movaps %xmm2,-0x38(%ebp)
+ .byte 15,41,77,216 // movaps %xmm1,-0x28(%ebp)
+ .byte 15,41,69,232 // movaps %xmm0,-0x18(%ebp)
+ .byte 232,0,0,0,0 // call 2103 <_sk_from_srgb_dst_sse2+0x1b>
+ .byte 89 // pop %ecx
.byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
- .byte 139,85,20 // mov 0x14(%ebp),%edx
- .byte 139,117,24 // mov 0x18(%ebp),%esi
- .byte 15,86,230 // orps %xmm6,%xmm4
- .byte 15,40,85,88 // movaps 0x58(%ebp),%xmm2
- .byte 139,125,12 // mov 0xc(%ebp),%edi
- .byte 141,95,4 // lea 0x4(%edi),%ebx
- .byte 15,41,84,36,80 // movaps %xmm2,0x50(%esp)
- .byte 137,116,36,16 // mov %esi,0x10(%esp)
- .byte 137,84,36,12 // mov %edx,0xc(%esp)
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
- .byte 15,41,100,36,64 // movaps %xmm4,0x40(%esp)
- .byte 15,41,68,36,48 // movaps %xmm0,0x30(%esp)
- .byte 15,41,76,36,32 // movaps %xmm1,0x20(%esp)
- .byte 15,40,69,200 // movaps -0x38(%ebp),%xmm0
- .byte 15,40,77,184 // movaps -0x48(%ebp),%xmm1
- .byte 15,40,85,168 // movaps -0x58(%ebp),%xmm2
- .byte 15,40,93,152 // movaps -0x68(%ebp),%xmm3
- .byte 255,23 // call *(%edi)
- .byte 129,196,188,0,0,0 // add $0xbc,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 15,40,72,16 // movaps 0x10(%eax),%xmm1
+ .byte 15,40,233 // movaps %xmm1,%xmm5
+ .byte 15,89,237 // mulps %xmm5,%xmm5
+ .byte 15,40,161,13,81,0,0 // movaps 0x510d(%ecx),%xmm4
+ .byte 15,40,193 // movaps %xmm1,%xmm0
+ .byte 15,89,196 // mulps %xmm4,%xmm0
+ .byte 15,40,177,29,81,0,0 // movaps 0x511d(%ecx),%xmm6
+ .byte 15,88,198 // addps %xmm6,%xmm0
+ .byte 15,89,197 // mulps %xmm5,%xmm0
+ .byte 15,40,169,253,80,0,0 // movaps 0x50fd(%ecx),%xmm5
+ .byte 15,40,209 // movaps %xmm1,%xmm2
+ .byte 15,89,213 // mulps %xmm5,%xmm2
+ .byte 15,40,185,45,81,0,0 // movaps 0x512d(%ecx),%xmm7
+ .byte 15,88,199 // addps %xmm7,%xmm0
+ .byte 15,40,153,61,81,0,0 // movaps 0x513d(%ecx),%xmm3
+ .byte 15,194,203,1 // cmpltps %xmm3,%xmm1
+ .byte 15,84,209 // andps %xmm1,%xmm2
+ .byte 15,85,200 // andnps %xmm0,%xmm1
+ .byte 15,86,202 // orps %xmm2,%xmm1
+ .byte 15,41,72,16 // movaps %xmm1,0x10(%eax)
+ .byte 15,40,64,32 // movaps 0x20(%eax),%xmm0
+ .byte 15,40,200 // movaps %xmm0,%xmm1
+ .byte 15,89,201 // mulps %xmm1,%xmm1
+ .byte 15,40,208 // movaps %xmm0,%xmm2
+ .byte 15,89,212 // mulps %xmm4,%xmm2
+ .byte 15,88,214 // addps %xmm6,%xmm2
+ .byte 15,89,209 // mulps %xmm1,%xmm2
+ .byte 15,40,200 // movaps %xmm0,%xmm1
+ .byte 15,89,205 // mulps %xmm5,%xmm1
+ .byte 15,88,215 // addps %xmm7,%xmm2
+ .byte 15,194,195,1 // cmpltps %xmm3,%xmm0
+ .byte 15,84,200 // andps %xmm0,%xmm1
+ .byte 15,85,194 // andnps %xmm2,%xmm0
+ .byte 15,86,193 // orps %xmm1,%xmm0
+ .byte 15,41,64,32 // movaps %xmm0,0x20(%eax)
+ .byte 15,40,64,48 // movaps 0x30(%eax),%xmm0
+ .byte 15,89,224 // mulps %xmm0,%xmm4
+ .byte 15,88,230 // addps %xmm6,%xmm4
+ .byte 15,40,200 // movaps %xmm0,%xmm1
+ .byte 15,89,201 // mulps %xmm1,%xmm1
+ .byte 15,89,225 // mulps %xmm1,%xmm4
+ .byte 15,88,231 // addps %xmm7,%xmm4
+ .byte 15,89,232 // mulps %xmm0,%xmm5
+ .byte 15,194,195,1 // cmpltps %xmm3,%xmm0
+ .byte 15,84,232 // andps %xmm0,%xmm5
+ .byte 15,85,196 // andnps %xmm4,%xmm0
+ .byte 15,86,197 // orps %xmm5,%xmm0
+ .byte 15,41,64,48 // movaps %xmm0,0x30(%eax)
+ .byte 139,77,12 // mov 0xc(%ebp),%ecx
+ .byte 141,81,4 // lea 0x4(%ecx),%edx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 15,40,69,232 // movaps -0x18(%ebp),%xmm0
+ .byte 15,40,77,216 // movaps -0x28(%ebp),%xmm1
+ .byte 15,40,85,200 // movaps -0x38(%ebp),%xmm2
+ .byte 15,40,93,184 // movaps -0x48(%ebp),%xmm3
+ .byte 82 // push %edx
+ .byte 80 // push %eax
+ .byte 255,17 // call *(%ecx)
+ .byte 131,196,88 // add $0x58,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -52450,36 +51601,33 @@ FUNCTION(_sk_to_srgb_sse2)
_sk_to_srgb_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 129,236,172,0,0,0 // sub $0xac,%esp
- .byte 15,41,93,168 // movaps %xmm3,-0x58(%ebp)
+ .byte 131,236,72 // sub $0x48,%esp
+ .byte 15,41,93,184 // movaps %xmm3,-0x48(%ebp)
.byte 15,40,250 // movaps %xmm2,%xmm7
.byte 15,40,241 // movaps %xmm1,%xmm6
.byte 15,40,208 // movaps %xmm0,%xmm2
- .byte 232,0,0,0,0 // call 2cf2 <_sk_to_srgb_sse2+0x1e>
+ .byte 232,0,0,0,0 // call 21ee <_sk_to_srgb_sse2+0x18>
.byte 88 // pop %eax
.byte 15,82,218 // rsqrtps %xmm2,%xmm3
- .byte 15,40,160,94,104,0,0 // movaps 0x685e(%eax),%xmm4
+ .byte 15,40,160,114,80,0,0 // movaps 0x5072(%eax),%xmm4
.byte 15,40,235 // movaps %xmm3,%xmm5
.byte 15,89,236 // mulps %xmm4,%xmm5
- .byte 15,40,128,110,104,0,0 // movaps 0x686e(%eax),%xmm0
- .byte 15,41,69,216 // movaps %xmm0,-0x28(%ebp)
+ .byte 15,40,128,130,80,0,0 // movaps 0x5082(%eax),%xmm0
+ .byte 15,41,69,232 // movaps %xmm0,-0x18(%ebp)
.byte 15,88,232 // addps %xmm0,%xmm5
.byte 15,89,235 // mulps %xmm3,%xmm5
- .byte 15,40,128,126,104,0,0 // movaps 0x687e(%eax),%xmm0
- .byte 15,41,69,184 // movaps %xmm0,-0x48(%ebp)
- .byte 15,88,232 // addps %xmm0,%xmm5
- .byte 15,40,128,142,104,0,0 // movaps 0x688e(%eax),%xmm0
+ .byte 15,40,128,146,80,0,0 // movaps 0x5092(%eax),%xmm0
.byte 15,41,69,200 // movaps %xmm0,-0x38(%ebp)
+ .byte 15,88,232 // addps %xmm0,%xmm5
+ .byte 15,40,128,162,80,0,0 // movaps 0x50a2(%eax),%xmm0
+ .byte 15,41,69,216 // movaps %xmm0,-0x28(%ebp)
.byte 15,88,216 // addps %xmm0,%xmm3
.byte 15,83,195 // rcpps %xmm3,%xmm0
.byte 15,89,197 // mulps %xmm5,%xmm0
- .byte 15,40,168,78,104,0,0 // movaps 0x684e(%eax),%xmm5
+ .byte 15,40,168,98,80,0,0 // movaps 0x5062(%eax),%xmm5
.byte 15,40,202 // movaps %xmm2,%xmm1
.byte 15,89,205 // mulps %xmm5,%xmm1
- .byte 15,40,152,158,104,0,0 // movaps 0x689e(%eax),%xmm3
+ .byte 15,40,152,178,80,0,0 // movaps 0x50b2(%eax),%xmm3
.byte 15,194,211,1 // cmpltps %xmm3,%xmm2
.byte 15,84,202 // andps %xmm2,%xmm1
.byte 15,85,208 // andnps %xmm0,%xmm2
@@ -52487,10 +51635,10 @@ _sk_to_srgb_sse2:
.byte 15,82,198 // rsqrtps %xmm6,%xmm0
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,89,204 // mulps %xmm4,%xmm1
- .byte 15,88,77,216 // addps -0x28(%ebp),%xmm1
+ .byte 15,88,77,232 // addps -0x18(%ebp),%xmm1
.byte 15,89,200 // mulps %xmm0,%xmm1
- .byte 15,88,77,184 // addps -0x48(%ebp),%xmm1
- .byte 15,88,69,200 // addps -0x38(%ebp),%xmm0
+ .byte 15,88,77,200 // addps -0x38(%ebp),%xmm1
+ .byte 15,88,69,216 // addps -0x28(%ebp),%xmm0
.byte 15,83,192 // rcpps %xmm0,%xmm0
.byte 15,89,193 // mulps %xmm1,%xmm0
.byte 15,40,206 // movaps %xmm6,%xmm1
@@ -52501,45 +51649,28 @@ _sk_to_srgb_sse2:
.byte 15,86,241 // orps %xmm1,%xmm6
.byte 15,82,199 // rsqrtps %xmm7,%xmm0
.byte 15,89,224 // mulps %xmm0,%xmm4
- .byte 15,88,101,216 // addps -0x28(%ebp),%xmm4
+ .byte 15,88,101,232 // addps -0x18(%ebp),%xmm4
.byte 15,89,224 // mulps %xmm0,%xmm4
- .byte 15,88,101,184 // addps -0x48(%ebp),%xmm4
- .byte 15,88,69,200 // addps -0x38(%ebp),%xmm0
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
- .byte 139,85,20 // mov 0x14(%ebp),%edx
- .byte 139,117,24 // mov 0x18(%ebp),%esi
+ .byte 15,88,101,200 // addps -0x38(%ebp),%xmm4
+ .byte 15,88,69,216 // addps -0x28(%ebp),%xmm0
.byte 15,83,192 // rcpps %xmm0,%xmm0
.byte 15,89,196 // mulps %xmm4,%xmm0
- .byte 15,40,77,40 // movaps 0x28(%ebp),%xmm1
.byte 15,89,239 // mulps %xmm7,%xmm5
.byte 15,194,251,1 // cmpltps %xmm3,%xmm7
- .byte 15,40,93,56 // movaps 0x38(%ebp),%xmm3
.byte 15,84,239 // andps %xmm7,%xmm5
.byte 15,85,248 // andnps %xmm0,%xmm7
- .byte 15,40,69,72 // movaps 0x48(%ebp),%xmm0
.byte 15,86,253 // orps %xmm5,%xmm7
- .byte 15,40,101,88 // movaps 0x58(%ebp),%xmm4
- .byte 139,125,12 // mov 0xc(%ebp),%edi
- .byte 141,95,4 // lea 0x4(%edi),%ebx
- .byte 15,41,100,36,80 // movaps %xmm4,0x50(%esp)
- .byte 15,41,68,36,64 // movaps %xmm0,0x40(%esp)
- .byte 15,41,92,36,48 // movaps %xmm3,0x30(%esp)
- .byte 15,41,76,36,32 // movaps %xmm1,0x20(%esp)
- .byte 137,116,36,16 // mov %esi,0x10(%esp)
- .byte 137,84,36,12 // mov %edx,0xc(%esp)
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
+ .byte 139,69,12 // mov 0xc(%ebp),%eax
+ .byte 141,72,4 // lea 0x4(%eax),%ecx
+ .byte 131,236,8 // sub $0x8,%esp
.byte 15,40,194 // movaps %xmm2,%xmm0
.byte 15,40,206 // movaps %xmm6,%xmm1
.byte 15,40,215 // movaps %xmm7,%xmm2
- .byte 15,40,93,168 // movaps -0x58(%ebp),%xmm3
- .byte 255,23 // call *(%edi)
- .byte 129,196,172,0,0,0 // add $0xac,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 15,40,93,184 // movaps -0x48(%ebp),%xmm3
+ .byte 81 // push %ecx
+ .byte 255,117,8 // pushl 0x8(%ebp)
+ .byte 255,16 // call *(%eax)
+ .byte 131,196,88 // add $0x58,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -52549,92 +51680,74 @@ FUNCTION(_sk_rgb_to_hsl_sse2)
_sk_rgb_to_hsl_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 129,236,156,0,0,0 // sub $0x9c,%esp
- .byte 15,41,93,184 // movaps %xmm3,-0x48(%ebp)
- .byte 15,40,233 // movaps %xmm1,%xmm5
+ .byte 131,236,56 // sub $0x38,%esp
+ .byte 15,41,93,200 // movaps %xmm3,-0x38(%ebp)
+ .byte 15,40,249 // movaps %xmm1,%xmm7
.byte 15,40,224 // movaps %xmm0,%xmm4
- .byte 232,0,0,0,0 // call 2e31 <_sk_rgb_to_hsl_sse2+0x1b>
+ .byte 232,0,0,0,0 // call 22e5 <_sk_rgb_to_hsl_sse2+0x15>
.byte 88 // pop %eax
.byte 15,40,204 // movaps %xmm4,%xmm1
- .byte 15,95,205 // maxps %xmm5,%xmm1
+ .byte 15,95,207 // maxps %xmm7,%xmm1
.byte 15,95,202 // maxps %xmm2,%xmm1
- .byte 15,40,252 // movaps %xmm4,%xmm7
- .byte 15,93,253 // minps %xmm5,%xmm7
- .byte 15,41,109,216 // movaps %xmm5,-0x28(%ebp)
- .byte 15,93,250 // minps %xmm2,%xmm7
+ .byte 15,40,220 // movaps %xmm4,%xmm3
+ .byte 15,93,223 // minps %xmm7,%xmm3
+ .byte 15,93,218 // minps %xmm2,%xmm3
+ .byte 15,41,93,232 // movaps %xmm3,-0x18(%ebp)
.byte 15,40,193 // movaps %xmm1,%xmm0
- .byte 15,92,199 // subps %xmm7,%xmm0
- .byte 15,41,69,200 // movaps %xmm0,-0x38(%ebp)
- .byte 15,40,152,111,103,0,0 // movaps 0x676f(%eax),%xmm3
+ .byte 15,92,195 // subps %xmm3,%xmm0
+ .byte 15,41,69,216 // movaps %xmm0,-0x28(%ebp)
+ .byte 15,40,152,203,79,0,0 // movaps 0x4fcb(%eax),%xmm3
.byte 15,94,216 // divps %xmm0,%xmm3
- .byte 15,40,197 // movaps %xmm5,%xmm0
+ .byte 15,40,199 // movaps %xmm7,%xmm0
.byte 15,92,194 // subps %xmm2,%xmm0
.byte 15,89,195 // mulps %xmm3,%xmm0
+ .byte 15,40,239 // movaps %xmm7,%xmm5
.byte 15,194,234,1 // cmpltps %xmm2,%xmm5
- .byte 15,84,168,127,103,0,0 // andps 0x677f(%eax),%xmm5
+ .byte 15,84,168,219,79,0,0 // andps 0x4fdb(%eax),%xmm5
.byte 15,88,232 // addps %xmm0,%xmm5
.byte 15,40,193 // movaps %xmm1,%xmm0
.byte 15,194,196,0 // cmpeqps %xmm4,%xmm0
.byte 15,40,241 // movaps %xmm1,%xmm6
- .byte 15,194,117,216,0 // cmpeqps -0x28(%ebp),%xmm6
+ .byte 15,194,247,0 // cmpeqps %xmm7,%xmm6
.byte 15,92,212 // subps %xmm4,%xmm2
- .byte 15,92,101,216 // subps -0x28(%ebp),%xmm4
+ .byte 15,92,231 // subps %xmm7,%xmm4
.byte 15,89,211 // mulps %xmm3,%xmm2
.byte 15,89,227 // mulps %xmm3,%xmm4
- .byte 15,40,152,143,103,0,0 // movaps 0x678f(%eax),%xmm3
+ .byte 15,40,152,235,79,0,0 // movaps 0x4feb(%eax),%xmm3
.byte 15,88,211 // addps %xmm3,%xmm2
- .byte 15,88,160,159,103,0,0 // addps 0x679f(%eax),%xmm4
+ .byte 15,88,160,251,79,0,0 // addps 0x4ffb(%eax),%xmm4
.byte 15,84,214 // andps %xmm6,%xmm2
.byte 15,85,244 // andnps %xmm4,%xmm6
.byte 15,86,242 // orps %xmm2,%xmm6
- .byte 139,77,8 // mov 0x8(%ebp),%ecx
- .byte 139,85,16 // mov 0x10(%ebp),%edx
- .byte 139,117,20 // mov 0x14(%ebp),%esi
- .byte 139,125,24 // mov 0x18(%ebp),%edi
.byte 15,84,232 // andps %xmm0,%xmm5
.byte 15,85,198 // andnps %xmm6,%xmm0
.byte 15,86,197 // orps %xmm5,%xmm0
.byte 15,40,225 // movaps %xmm1,%xmm4
- .byte 15,194,231,4 // cmpneqps %xmm7,%xmm4
+ .byte 15,40,85,232 // movaps -0x18(%ebp),%xmm2
+ .byte 15,194,226,4 // cmpneqps %xmm2,%xmm4
.byte 15,92,217 // subps %xmm1,%xmm3
- .byte 15,88,207 // addps %xmm7,%xmm1
- .byte 15,40,168,191,103,0,0 // movaps 0x67bf(%eax),%xmm5
- .byte 15,92,223 // subps %xmm7,%xmm3
+ .byte 15,88,202 // addps %xmm2,%xmm1
+ .byte 15,40,168,27,80,0,0 // movaps 0x501b(%eax),%xmm5
+ .byte 15,92,218 // subps %xmm2,%xmm3
.byte 15,40,209 // movaps %xmm1,%xmm2
.byte 15,89,213 // mulps %xmm5,%xmm2
.byte 15,194,234,1 // cmpltps %xmm2,%xmm5
.byte 15,84,221 // andps %xmm5,%xmm3
.byte 15,85,233 // andnps %xmm1,%xmm5
- .byte 15,40,117,40 // movaps 0x28(%ebp),%xmm6
.byte 15,86,235 // orps %xmm3,%xmm5
- .byte 15,40,93,56 // movaps 0x38(%ebp),%xmm3
- .byte 15,40,77,200 // movaps -0x38(%ebp),%xmm1
+ .byte 15,40,77,216 // movaps -0x28(%ebp),%xmm1
.byte 15,94,205 // divps %xmm5,%xmm1
- .byte 15,40,109,72 // movaps 0x48(%ebp),%xmm5
- .byte 15,89,128,175,103,0,0 // mulps 0x67af(%eax),%xmm0
+ .byte 15,89,128,11,80,0,0 // mulps 0x500b(%eax),%xmm0
.byte 15,84,196 // andps %xmm4,%xmm0
.byte 15,84,204 // andps %xmm4,%xmm1
- .byte 15,40,101,88 // movaps 0x58(%ebp),%xmm4
.byte 139,69,12 // mov 0xc(%ebp),%eax
- .byte 141,88,4 // lea 0x4(%eax),%ebx
- .byte 15,41,100,36,80 // movaps %xmm4,0x50(%esp)
- .byte 15,41,108,36,64 // movaps %xmm5,0x40(%esp)
- .byte 15,41,92,36,48 // movaps %xmm3,0x30(%esp)
- .byte 15,41,116,36,32 // movaps %xmm6,0x20(%esp)
- .byte 137,124,36,16 // mov %edi,0x10(%esp)
- .byte 137,116,36,12 // mov %esi,0xc(%esp)
- .byte 137,84,36,8 // mov %edx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,12,36 // mov %ecx,(%esp)
- .byte 15,40,93,184 // movaps -0x48(%ebp),%xmm3
+ .byte 141,72,4 // lea 0x4(%eax),%ecx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 15,40,93,200 // movaps -0x38(%ebp),%xmm3
+ .byte 81 // push %ecx
+ .byte 255,117,8 // pushl 0x8(%ebp)
.byte 255,16 // call *(%eax)
- .byte 129,196,156,0,0,0 // add $0x9c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 131,196,72 // add $0x48,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -52644,180 +51757,159 @@ FUNCTION(_sk_hsl_to_rgb_sse2)
_sk_hsl_to_rgb_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 129,236,44,1,0,0 // sub $0x12c,%esp
- .byte 15,41,157,40,255,255,255 // movaps %xmm3,-0xd8(%ebp)
- .byte 15,41,69,200 // movaps %xmm0,-0x38(%ebp)
- .byte 232,0,0,0,0 // call 2f66 <_sk_hsl_to_rgb_sse2+0x1c>
+ .byte 129,236,200,0,0,0 // sub $0xc8,%esp
+ .byte 15,41,157,56,255,255,255 // movaps %xmm3,-0xc8(%ebp)
+ .byte 15,41,69,184 // movaps %xmm0,-0x48(%ebp)
+ .byte 232,0,0,0,0 // call 23da <_sk_hsl_to_rgb_sse2+0x19>
.byte 88 // pop %eax
- .byte 15,40,152,154,102,0,0 // movaps 0x669a(%eax),%xmm3
- .byte 15,40,227 // movaps %xmm3,%xmm4
- .byte 15,40,243 // movaps %xmm3,%xmm6
- .byte 15,41,181,72,255,255,255 // movaps %xmm6,-0xb8(%ebp)
- .byte 15,194,226,2 // cmpleps %xmm2,%xmm4
- .byte 15,40,233 // movaps %xmm1,%xmm5
- .byte 15,87,219 // xorps %xmm3,%xmm3
- .byte 15,194,217,0 // cmpeqps %xmm1,%xmm3
- .byte 15,41,93,216 // movaps %xmm3,-0x28(%ebp)
+ .byte 15,40,160,54,79,0,0 // movaps 0x4f36(%eax),%xmm4
+ .byte 15,40,220 // movaps %xmm4,%xmm3
+ .byte 15,41,165,104,255,255,255 // movaps %xmm4,-0x98(%ebp)
+ .byte 15,194,218,2 // cmpleps %xmm2,%xmm3
+ .byte 15,40,241 // movaps %xmm1,%xmm6
+ .byte 15,87,237 // xorps %xmm5,%xmm5
+ .byte 15,194,233,0 // cmpeqps %xmm1,%xmm5
+ .byte 15,41,109,232 // movaps %xmm5,-0x18(%ebp)
.byte 15,89,202 // mulps %xmm2,%xmm1
- .byte 15,92,233 // subps %xmm1,%xmm5
- .byte 15,84,236 // andps %xmm4,%xmm5
- .byte 15,85,225 // andnps %xmm1,%xmm4
- .byte 15,86,229 // orps %xmm5,%xmm4
- .byte 15,40,136,170,102,0,0 // movaps 0x66aa(%eax),%xmm1
- .byte 15,88,200 // addps %xmm0,%xmm1
- .byte 243,15,91,193 // cvttps2dq %xmm1,%xmm0
- .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,40,217 // movaps %xmm1,%xmm3
- .byte 15,194,216,1 // cmpltps %xmm0,%xmm3
- .byte 15,40,168,186,102,0,0 // movaps 0x66ba(%eax),%xmm5
- .byte 15,41,173,104,255,255,255 // movaps %xmm5,-0x98(%ebp)
- .byte 15,84,221 // andps %xmm5,%xmm3
- .byte 15,92,195 // subps %xmm3,%xmm0
- .byte 15,92,200 // subps %xmm0,%xmm1
- .byte 15,40,234 // movaps %xmm2,%xmm5
- .byte 15,41,173,56,255,255,255 // movaps %xmm5,-0xc8(%ebp)
- .byte 15,88,229 // addps %xmm5,%xmm4
- .byte 15,41,101,184 // movaps %xmm4,-0x48(%ebp)
- .byte 15,88,237 // addps %xmm5,%xmm5
- .byte 15,92,236 // subps %xmm4,%xmm5
- .byte 15,40,144,202,102,0,0 // movaps 0x66ca(%eax),%xmm2
- .byte 15,41,85,168 // movaps %xmm2,-0x58(%ebp)
- .byte 15,194,209,2 // cmpleps %xmm1,%xmm2
- .byte 15,92,229 // subps %xmm5,%xmm4
- .byte 15,40,198 // movaps %xmm6,%xmm0
- .byte 15,194,193,2 // cmpleps %xmm1,%xmm0
- .byte 15,40,176,250,102,0,0 // movaps 0x66fa(%eax),%xmm6
- .byte 15,41,181,88,255,255,255 // movaps %xmm6,-0xa8(%ebp)
- .byte 15,194,241,2 // cmpleps %xmm1,%xmm6
- .byte 15,40,152,218,102,0,0 // movaps 0x66da(%eax),%xmm3
- .byte 15,41,93,152 // movaps %xmm3,-0x68(%ebp)
- .byte 15,89,203 // mulps %xmm3,%xmm1
- .byte 15,40,184,234,102,0,0 // movaps 0x66ea(%eax),%xmm7
- .byte 15,41,125,136 // movaps %xmm7,-0x78(%ebp)
- .byte 15,92,249 // subps %xmm1,%xmm7
- .byte 15,89,252 // mulps %xmm4,%xmm7
- .byte 15,88,253 // addps %xmm5,%xmm7
- .byte 15,40,221 // movaps %xmm5,%xmm3
- .byte 15,84,218 // andps %xmm2,%xmm3
- .byte 15,85,215 // andnps %xmm7,%xmm2
- .byte 15,86,211 // orps %xmm3,%xmm2
- .byte 15,84,208 // andps %xmm0,%xmm2
- .byte 15,85,69,184 // andnps -0x48(%ebp),%xmm0
- .byte 15,86,194 // orps %xmm2,%xmm0
- .byte 15,89,204 // mulps %xmm4,%xmm1
- .byte 15,88,205 // addps %xmm5,%xmm1
+ .byte 15,92,241 // subps %xmm1,%xmm6
+ .byte 15,84,243 // andps %xmm3,%xmm6
+ .byte 15,85,217 // andnps %xmm1,%xmm3
+ .byte 15,86,222 // orps %xmm6,%xmm3
+ .byte 15,40,168,70,79,0,0 // movaps 0x4f46(%eax),%xmm5
+ .byte 15,88,232 // addps %xmm0,%xmm5
+ .byte 243,15,91,205 // cvttps2dq %xmm5,%xmm1
+ .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
+ .byte 15,40,197 // movaps %xmm5,%xmm0
+ .byte 15,194,193,1 // cmpltps %xmm1,%xmm0
+ .byte 15,40,176,86,79,0,0 // movaps 0x4f56(%eax),%xmm6
+ .byte 15,41,117,136 // movaps %xmm6,-0x78(%ebp)
.byte 15,84,198 // andps %xmm6,%xmm0
- .byte 15,85,241 // andnps %xmm1,%xmm6
- .byte 15,86,240 // orps %xmm0,%xmm6
- .byte 15,40,69,216 // movaps -0x28(%ebp),%xmm0
- .byte 15,85,198 // andnps %xmm6,%xmm0
- .byte 15,41,133,120,255,255,255 // movaps %xmm0,-0x88(%ebp)
- .byte 15,40,85,200 // movaps -0x38(%ebp),%xmm2
- .byte 243,15,91,194 // cvttps2dq %xmm2,%xmm0
+ .byte 15,92,200 // subps %xmm0,%xmm1
+ .byte 15,92,233 // subps %xmm1,%xmm5
+ .byte 15,41,149,72,255,255,255 // movaps %xmm2,-0xb8(%ebp)
+ .byte 15,88,218 // addps %xmm2,%xmm3
+ .byte 15,41,93,216 // movaps %xmm3,-0x28(%ebp)
+ .byte 15,88,210 // addps %xmm2,%xmm2
+ .byte 15,92,211 // subps %xmm3,%xmm2
+ .byte 15,40,184,102,79,0,0 // movaps 0x4f66(%eax),%xmm7
+ .byte 15,41,189,88,255,255,255 // movaps %xmm7,-0xa8(%ebp)
+ .byte 15,194,253,2 // cmpleps %xmm5,%xmm7
+ .byte 15,92,218 // subps %xmm2,%xmm3
+ .byte 15,41,93,200 // movaps %xmm3,-0x38(%ebp)
+ .byte 15,40,204 // movaps %xmm4,%xmm1
+ .byte 15,194,205,2 // cmpleps %xmm5,%xmm1
+ .byte 15,40,160,150,79,0,0 // movaps 0x4f96(%eax),%xmm4
+ .byte 15,41,165,120,255,255,255 // movaps %xmm4,-0x88(%ebp)
+ .byte 15,194,229,2 // cmpleps %xmm5,%xmm4
+ .byte 15,40,176,118,79,0,0 // movaps 0x4f76(%eax),%xmm6
+ .byte 15,89,238 // mulps %xmm6,%xmm5
+ .byte 15,40,128,134,79,0,0 // movaps 0x4f86(%eax),%xmm0
+ .byte 15,41,69,168 // movaps %xmm0,-0x58(%ebp)
+ .byte 15,92,197 // subps %xmm5,%xmm0
+ .byte 15,89,195 // mulps %xmm3,%xmm0
+ .byte 15,88,194 // addps %xmm2,%xmm0
+ .byte 15,40,218 // movaps %xmm2,%xmm3
+ .byte 15,84,223 // andps %xmm7,%xmm3
+ .byte 15,85,248 // andnps %xmm0,%xmm7
+ .byte 15,86,251 // orps %xmm3,%xmm7
+ .byte 15,84,249 // andps %xmm1,%xmm7
+ .byte 15,85,77,216 // andnps -0x28(%ebp),%xmm1
+ .byte 15,86,207 // orps %xmm7,%xmm1
+ .byte 15,40,125,200 // movaps -0x38(%ebp),%xmm7
+ .byte 15,89,239 // mulps %xmm7,%xmm5
+ .byte 15,88,234 // addps %xmm2,%xmm5
+ .byte 15,84,204 // andps %xmm4,%xmm1
+ .byte 15,85,229 // andnps %xmm5,%xmm4
+ .byte 15,86,225 // orps %xmm1,%xmm4
+ .byte 15,40,69,232 // movaps -0x18(%ebp),%xmm0
+ .byte 15,85,196 // andnps %xmm4,%xmm0
+ .byte 15,41,69,152 // movaps %xmm0,-0x68(%ebp)
+ .byte 15,40,93,184 // movaps -0x48(%ebp),%xmm3
+ .byte 243,15,91,195 // cvttps2dq %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,40,202 // movaps %xmm2,%xmm1
+ .byte 15,40,203 // movaps %xmm3,%xmm1
.byte 15,194,200,1 // cmpltps %xmm0,%xmm1
- .byte 15,84,136,186,102,0,0 // andps 0x66ba(%eax),%xmm1
+ .byte 15,84,136,86,79,0,0 // andps 0x4f56(%eax),%xmm1
.byte 15,92,193 // subps %xmm1,%xmm0
- .byte 15,40,202 // movaps %xmm2,%xmm1
+ .byte 15,40,203 // movaps %xmm3,%xmm1
.byte 15,92,200 // subps %xmm0,%xmm1
- .byte 15,40,128,202,102,0,0 // movaps 0x66ca(%eax),%xmm0
+ .byte 15,40,128,102,79,0,0 // movaps 0x4f66(%eax),%xmm0
.byte 15,194,193,2 // cmpleps %xmm1,%xmm0
- .byte 15,40,144,154,102,0,0 // movaps 0x669a(%eax),%xmm2
- .byte 15,194,209,2 // cmpleps %xmm1,%xmm2
- .byte 15,40,152,250,102,0,0 // movaps 0x66fa(%eax),%xmm3
+ .byte 15,40,152,54,79,0,0 // movaps 0x4f36(%eax),%xmm3
.byte 15,194,217,2 // cmpleps %xmm1,%xmm3
- .byte 15,89,136,218,102,0,0 // mulps 0x66da(%eax),%xmm1
- .byte 15,40,176,234,102,0,0 // movaps 0x66ea(%eax),%xmm6
- .byte 15,92,241 // subps %xmm1,%xmm6
- .byte 15,89,244 // mulps %xmm4,%xmm6
- .byte 15,88,245 // addps %xmm5,%xmm6
- .byte 15,40,253 // movaps %xmm5,%xmm7
+ .byte 15,40,160,150,79,0,0 // movaps 0x4f96(%eax),%xmm4
+ .byte 15,194,225,2 // cmpleps %xmm1,%xmm4
+ .byte 15,89,206 // mulps %xmm6,%xmm1
+ .byte 15,40,168,134,79,0,0 // movaps 0x4f86(%eax),%xmm5
+ .byte 15,92,233 // subps %xmm1,%xmm5
+ .byte 15,89,239 // mulps %xmm7,%xmm5
+ .byte 15,88,234 // addps %xmm2,%xmm5
+ .byte 15,40,250 // movaps %xmm2,%xmm7
.byte 15,84,248 // andps %xmm0,%xmm7
- .byte 15,85,198 // andnps %xmm6,%xmm0
+ .byte 15,85,197 // andnps %xmm5,%xmm0
.byte 15,86,199 // orps %xmm7,%xmm0
- .byte 15,84,194 // andps %xmm2,%xmm0
- .byte 15,40,125,184 // movaps -0x48(%ebp),%xmm7
- .byte 15,85,215 // andnps %xmm7,%xmm2
- .byte 15,86,208 // orps %xmm0,%xmm2
- .byte 15,89,204 // mulps %xmm4,%xmm1
- .byte 15,88,205 // addps %xmm5,%xmm1
- .byte 15,84,211 // andps %xmm3,%xmm2
- .byte 15,85,217 // andnps %xmm1,%xmm3
- .byte 15,86,218 // orps %xmm2,%xmm3
- .byte 15,40,117,216 // movaps -0x28(%ebp),%xmm6
- .byte 15,85,243 // andnps %xmm3,%xmm6
- .byte 15,40,85,200 // movaps -0x38(%ebp),%xmm2
- .byte 15,88,144,10,103,0,0 // addps 0x670a(%eax),%xmm2
- .byte 243,15,91,194 // cvttps2dq %xmm2,%xmm0
+ .byte 15,84,195 // andps %xmm3,%xmm0
+ .byte 15,85,93,216 // andnps -0x28(%ebp),%xmm3
+ .byte 15,86,216 // orps %xmm0,%xmm3
+ .byte 15,40,109,200 // movaps -0x38(%ebp),%xmm5
+ .byte 15,89,205 // mulps %xmm5,%xmm1
+ .byte 15,88,202 // addps %xmm2,%xmm1
+ .byte 15,84,220 // andps %xmm4,%xmm3
+ .byte 15,85,225 // andnps %xmm1,%xmm4
+ .byte 15,86,227 // orps %xmm3,%xmm4
+ .byte 15,40,125,232 // movaps -0x18(%ebp),%xmm7
+ .byte 15,85,252 // andnps %xmm4,%xmm7
+ .byte 15,40,93,184 // movaps -0x48(%ebp),%xmm3
+ .byte 15,88,152,166,79,0,0 // addps 0x4fa6(%eax),%xmm3
+ .byte 243,15,91,195 // cvttps2dq %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,40,202 // movaps %xmm2,%xmm1
+ .byte 15,40,203 // movaps %xmm3,%xmm1
.byte 15,194,200,1 // cmpltps %xmm0,%xmm1
- .byte 15,84,141,104,255,255,255 // andps -0x98(%ebp),%xmm1
+ .byte 15,84,77,136 // andps -0x78(%ebp),%xmm1
.byte 15,92,193 // subps %xmm1,%xmm0
- .byte 15,92,208 // subps %xmm0,%xmm2
- .byte 15,40,77,152 // movaps -0x68(%ebp),%xmm1
- .byte 15,89,202 // mulps %xmm2,%xmm1
- .byte 15,40,93,136 // movaps -0x78(%ebp),%xmm3
- .byte 15,92,217 // subps %xmm1,%xmm3
- .byte 15,89,220 // mulps %xmm4,%xmm3
- .byte 15,89,204 // mulps %xmm4,%xmm1
- .byte 15,88,221 // addps %xmm5,%xmm3
- .byte 15,88,205 // addps %xmm5,%xmm1
- .byte 15,40,229 // movaps %xmm5,%xmm4
- .byte 15,40,109,168 // movaps -0x58(%ebp),%xmm5
- .byte 15,194,234,2 // cmpleps %xmm2,%xmm5
- .byte 15,84,229 // andps %xmm5,%xmm4
- .byte 15,85,235 // andnps %xmm3,%xmm5
- .byte 15,86,236 // orps %xmm4,%xmm5
- .byte 15,40,133,72,255,255,255 // movaps -0xb8(%ebp),%xmm0
- .byte 15,194,194,2 // cmpleps %xmm2,%xmm0
- .byte 15,84,232 // andps %xmm0,%xmm5
- .byte 15,85,199 // andnps %xmm7,%xmm0
- .byte 15,86,197 // orps %xmm5,%xmm0
- .byte 15,40,157,88,255,255,255 // movaps -0xa8(%ebp),%xmm3
- .byte 15,194,218,2 // cmpleps %xmm2,%xmm3
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
- .byte 139,85,20 // mov 0x14(%ebp),%edx
- .byte 139,117,24 // mov 0x18(%ebp),%esi
- .byte 15,84,195 // andps %xmm3,%xmm0
- .byte 15,85,217 // andnps %xmm1,%xmm3
- .byte 15,40,109,40 // movaps 0x28(%ebp),%xmm5
- .byte 15,86,216 // orps %xmm0,%xmm3
- .byte 15,40,227 // movaps %xmm3,%xmm4
- .byte 15,40,77,56 // movaps 0x38(%ebp),%xmm1
- .byte 15,40,149,56,255,255,255 // movaps -0xc8(%ebp),%xmm2
- .byte 15,40,93,216 // movaps -0x28(%ebp),%xmm3
- .byte 15,84,211 // andps %xmm3,%xmm2
- .byte 15,85,220 // andnps %xmm4,%xmm3
- .byte 15,40,101,72 // movaps 0x48(%ebp),%xmm4
- .byte 15,40,133,120,255,255,255 // movaps -0x88(%ebp),%xmm0
- .byte 15,86,194 // orps %xmm2,%xmm0
- .byte 15,86,242 // orps %xmm2,%xmm6
- .byte 15,86,211 // orps %xmm3,%xmm2
- .byte 15,40,93,88 // movaps 0x58(%ebp),%xmm3
- .byte 139,125,12 // mov 0xc(%ebp),%edi
- .byte 141,95,4 // lea 0x4(%edi),%ebx
- .byte 15,41,92,36,80 // movaps %xmm3,0x50(%esp)
- .byte 15,41,100,36,64 // movaps %xmm4,0x40(%esp)
- .byte 15,41,76,36,48 // movaps %xmm1,0x30(%esp)
- .byte 15,41,108,36,32 // movaps %xmm5,0x20(%esp)
- .byte 137,116,36,16 // mov %esi,0x10(%esp)
- .byte 137,84,36,12 // mov %edx,0xc(%esp)
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
- .byte 15,40,206 // movaps %xmm6,%xmm1
- .byte 15,40,157,40,255,255,255 // movaps -0xd8(%ebp),%xmm3
- .byte 255,23 // call *(%edi)
- .byte 129,196,44,1,0,0 // add $0x12c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 15,92,216 // subps %xmm0,%xmm3
+ .byte 15,89,243 // mulps %xmm3,%xmm6
+ .byte 15,40,77,168 // movaps -0x58(%ebp),%xmm1
+ .byte 15,92,206 // subps %xmm6,%xmm1
+ .byte 15,89,205 // mulps %xmm5,%xmm1
+ .byte 15,40,225 // movaps %xmm1,%xmm4
+ .byte 15,89,245 // mulps %xmm5,%xmm6
+ .byte 15,88,226 // addps %xmm2,%xmm4
+ .byte 15,88,242 // addps %xmm2,%xmm6
+ .byte 15,40,141,88,255,255,255 // movaps -0xa8(%ebp),%xmm1
+ .byte 15,194,203,2 // cmpleps %xmm3,%xmm1
+ .byte 15,84,209 // andps %xmm1,%xmm2
+ .byte 15,85,204 // andnps %xmm4,%xmm1
+ .byte 15,86,202 // orps %xmm2,%xmm1
+ .byte 15,40,133,104,255,255,255 // movaps -0x98(%ebp),%xmm0
+ .byte 15,194,195,2 // cmpleps %xmm3,%xmm0
+ .byte 15,84,200 // andps %xmm0,%xmm1
+ .byte 15,85,69,216 // andnps -0x28(%ebp),%xmm0
+ .byte 15,86,193 // orps %xmm1,%xmm0
+ .byte 15,40,141,120,255,255,255 // movaps -0x88(%ebp),%xmm1
+ .byte 15,194,203,2 // cmpleps %xmm3,%xmm1
+ .byte 15,84,193 // andps %xmm1,%xmm0
+ .byte 15,85,206 // andnps %xmm6,%xmm1
+ .byte 15,86,200 // orps %xmm0,%xmm1
+ .byte 15,40,209 // movaps %xmm1,%xmm2
+ .byte 15,40,157,72,255,255,255 // movaps -0xb8(%ebp),%xmm3
+ .byte 15,40,77,232 // movaps -0x18(%ebp),%xmm1
+ .byte 15,84,217 // andps %xmm1,%xmm3
+ .byte 15,85,202 // andnps %xmm2,%xmm1
+ .byte 15,40,69,152 // movaps -0x68(%ebp),%xmm0
+ .byte 15,86,195 // orps %xmm3,%xmm0
+ .byte 15,86,251 // orps %xmm3,%xmm7
+ .byte 15,86,217 // orps %xmm1,%xmm3
+ .byte 15,40,211 // movaps %xmm3,%xmm2
+ .byte 139,69,12 // mov 0xc(%ebp),%eax
+ .byte 141,72,4 // lea 0x4(%eax),%ecx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 15,40,207 // movaps %xmm7,%xmm1
+ .byte 15,40,157,56,255,255,255 // movaps -0xc8(%ebp),%xmm3
+ .byte 81 // push %ecx
+ .byte 255,117,8 // pushl 0x8(%ebp)
+ .byte 255,16 // call *(%eax)
+ .byte 129,196,216,0,0,0 // add $0xd8,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -52827,41 +51919,21 @@ FUNCTION(_sk_scale_1_float_sse2)
_sk_scale_1_float_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
- .byte 139,85,20 // mov 0x14(%ebp),%edx
- .byte 139,117,12 // mov 0xc(%ebp),%esi
- .byte 139,62 // mov (%esi),%edi
- .byte 243,15,16,39 // movss (%edi),%xmm4
- .byte 139,125,24 // mov 0x18(%ebp),%edi
- .byte 15,40,109,40 // movaps 0x28(%ebp),%xmm5
- .byte 15,40,117,56 // movaps 0x38(%ebp),%xmm6
- .byte 15,40,125,72 // movaps 0x48(%ebp),%xmm7
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 139,69,12 // mov 0xc(%ebp),%eax
+ .byte 139,8 // mov (%eax),%ecx
+ .byte 243,15,16,33 // movss (%ecx),%xmm4
.byte 15,198,228,0 // shufps $0x0,%xmm4,%xmm4
.byte 15,89,196 // mulps %xmm4,%xmm0
.byte 15,89,204 // mulps %xmm4,%xmm1
.byte 15,89,212 // mulps %xmm4,%xmm2
.byte 15,89,220 // mulps %xmm4,%xmm3
- .byte 15,40,101,88 // movaps 0x58(%ebp),%xmm4
- .byte 141,94,8 // lea 0x8(%esi),%ebx
- .byte 15,41,100,36,80 // movaps %xmm4,0x50(%esp)
- .byte 15,41,124,36,64 // movaps %xmm7,0x40(%esp)
- .byte 15,41,116,36,48 // movaps %xmm6,0x30(%esp)
- .byte 15,41,108,36,32 // movaps %xmm5,0x20(%esp)
- .byte 137,124,36,16 // mov %edi,0x10(%esp)
- .byte 137,84,36,12 // mov %edx,0xc(%esp)
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
- .byte 255,86,4 // call *0x4(%esi)
- .byte 131,196,108 // add $0x6c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 141,72,8 // lea 0x8(%eax),%ecx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 81 // push %ecx
+ .byte 255,117,8 // pushl 0x8(%ebp)
+ .byte 255,80,4 // call *0x4(%eax)
+ .byte 131,196,24 // add $0x18,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -52874,74 +51946,61 @@ _sk_scale_u8_sse2:
.byte 83 // push %ebx
.byte 87 // push %edi
.byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 232,0,0,0,0 // call 326c <_sk_scale_u8_sse2+0xe>
- .byte 95 // pop %edi
- .byte 15,40,125,72 // movaps 0x48(%ebp),%xmm7
- .byte 15,40,117,56 // movaps 0x38(%ebp),%xmm6
- .byte 15,40,109,40 // movaps 0x28(%ebp),%xmm5
+ .byte 131,236,12 // sub $0xc,%esp
+ .byte 232,0,0,0,0 // call 2654 <_sk_scale_u8_sse2+0xe>
+ .byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
- .byte 139,48 // mov (%eax),%esi
- .byte 139,86,4 // mov 0x4(%esi),%edx
- .byte 15,175,85,20 // imul 0x14(%ebp),%edx
- .byte 3,22 // add (%esi),%edx
- .byte 139,93,24 // mov 0x18(%ebp),%ebx
+ .byte 139,77,8 // mov 0x8(%ebp),%ecx
+ .byte 139,56 // mov (%eax),%edi
+ .byte 139,119,4 // mov 0x4(%edi),%esi
+ .byte 15,175,113,4 // imul 0x4(%ecx),%esi
+ .byte 3,55 // add (%edi),%esi
+ .byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
- .byte 139,117,16 // mov 0x10(%ebp),%esi
- .byte 117,109 // jne 32fe <_sk_scale_u8_sse2+0xa0>
- .byte 102,15,110,36,50 // movd (%edx,%esi,1),%xmm4
+ .byte 139,57 // mov (%ecx),%edi
+ .byte 117,65 // jne 26b0 <_sk_scale_u8_sse2+0x6a>
+ .byte 102,15,110,36,62 // movd (%esi,%edi,1),%xmm4
.byte 102,15,96,224 // punpcklbw %xmm0,%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
- .byte 102,15,219,167,20,100,0,0 // pand 0x6414(%edi),%xmm4
+ .byte 102,15,219,162,60,77,0,0 // pand 0x4d3c(%edx),%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,167,36,100,0,0 // mulps 0x6424(%edi),%xmm4
+ .byte 15,89,162,76,77,0,0 // mulps 0x4d4c(%edx),%xmm4
.byte 15,89,196 // mulps %xmm4,%xmm0
.byte 15,89,204 // mulps %xmm4,%xmm1
.byte 15,89,212 // mulps %xmm4,%xmm2
.byte 15,89,227 // mulps %xmm3,%xmm4
- .byte 141,72,8 // lea 0x8(%eax),%ecx
- .byte 15,40,93,88 // movaps 0x58(%ebp),%xmm3
- .byte 15,41,92,36,80 // movaps %xmm3,0x50(%esp)
- .byte 15,41,124,36,64 // movaps %xmm7,0x40(%esp)
- .byte 15,41,116,36,48 // movaps %xmm6,0x30(%esp)
- .byte 15,41,108,36,32 // movaps %xmm5,0x20(%esp)
- .byte 137,92,36,16 // mov %ebx,0x10(%esp)
- .byte 139,85,20 // mov 0x14(%ebp),%edx
- .byte 137,84,36,12 // mov %edx,0xc(%esp)
- .byte 137,116,36,8 // mov %esi,0x8(%esp)
- .byte 137,76,36,4 // mov %ecx,0x4(%esp)
- .byte 139,77,8 // mov 0x8(%ebp),%ecx
- .byte 137,12,36 // mov %ecx,(%esp)
+ .byte 141,80,8 // lea 0x8(%eax),%edx
+ .byte 131,236,8 // sub $0x8,%esp
.byte 15,40,220 // movaps %xmm4,%xmm3
+ .byte 82 // push %edx
+ .byte 81 // push %ecx
.byte 255,80,4 // call *0x4(%eax)
- .byte 131,196,108 // add $0x6c,%esp
+ .byte 131,196,28 // add $0x1c,%esp
.byte 94 // pop %esi
.byte 95 // pop %edi
.byte 91 // pop %ebx
.byte 93 // pop %ebp
.byte 195 // ret
- .byte 137,217 // mov %ebx,%ecx
- .byte 128,225,3 // and $0x3,%cl
- .byte 128,249,1 // cmp $0x1,%cl
- .byte 116,57 // je 3341 <_sk_scale_u8_sse2+0xe3>
+ .byte 128,227,3 // and $0x3,%bl
+ .byte 128,251,1 // cmp $0x1,%bl
+ .byte 116,50 // je 26ea <_sk_scale_u8_sse2+0xa4>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
- .byte 128,249,2 // cmp $0x2,%cl
- .byte 116,19 // je 3324 <_sk_scale_u8_sse2+0xc6>
- .byte 128,249,3 // cmp $0x3,%cl
- .byte 117,136 // jne 329e <_sk_scale_u8_sse2+0x40>
- .byte 15,182,76,50,2 // movzbl 0x2(%edx,%esi,1),%ecx
- .byte 102,15,110,225 // movd %ecx,%xmm4
+ .byte 128,251,2 // cmp $0x2,%bl
+ .byte 116,19 // je 26d4 <_sk_scale_u8_sse2+0x8e>
+ .byte 128,251,3 // cmp $0x3,%bl
+ .byte 117,182 // jne 267c <_sk_scale_u8_sse2+0x36>
+ .byte 15,182,92,62,2 // movzbl 0x2(%esi,%edi,1),%ebx
+ .byte 102,15,110,227 // movd %ebx,%xmm4
.byte 102,15,112,228,69 // pshufd $0x45,%xmm4,%xmm4
- .byte 15,183,12,50 // movzwl (%edx,%esi,1),%ecx
- .byte 102,15,110,233 // movd %ecx,%xmm5
+ .byte 15,183,52,62 // movzwl (%esi,%edi,1),%esi
+ .byte 102,15,110,238 // movd %esi,%xmm5
.byte 102,15,96,232 // punpcklbw %xmm0,%xmm5
.byte 102,15,97,232 // punpcklwd %xmm0,%xmm5
.byte 242,15,16,229 // movsd %xmm5,%xmm4
- .byte 15,40,109,40 // movaps 0x28(%ebp),%xmm5
- .byte 233,93,255,255,255 // jmp 329e <_sk_scale_u8_sse2+0x40>
- .byte 15,182,12,50 // movzbl (%edx,%esi,1),%ecx
- .byte 102,15,110,225 // movd %ecx,%xmm4
- .byte 233,80,255,255,255 // jmp 329e <_sk_scale_u8_sse2+0x40>
+ .byte 235,146 // jmp 267c <_sk_scale_u8_sse2+0x36>
+ .byte 15,182,52,62 // movzbl (%esi,%edi,1),%esi
+ .byte 102,15,110,230 // movd %esi,%xmm4
+ .byte 235,136 // jmp 267c <_sk_scale_u8_sse2+0x36>
HIDDEN _sk_lerp_1_float_sse2
.globl _sk_lerp_1_float_sse2
@@ -52949,49 +52008,34 @@ FUNCTION(_sk_lerp_1_float_sse2)
_sk_lerp_1_float_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 15,40,109,56 // movaps 0x38(%ebp),%xmm5
- .byte 15,40,117,40 // movaps 0x28(%ebp),%xmm6
- .byte 139,69,12 // mov 0xc(%ebp),%eax
- .byte 139,8 // mov (%eax),%ecx
- .byte 243,15,16,57 // movss (%ecx),%xmm7
- .byte 15,198,255,0 // shufps $0x0,%xmm7,%xmm7
- .byte 15,92,198 // subps %xmm6,%xmm0
- .byte 15,89,199 // mulps %xmm7,%xmm0
- .byte 15,92,205 // subps %xmm5,%xmm1
- .byte 15,89,207 // mulps %xmm7,%xmm1
- .byte 15,92,85,72 // subps 0x48(%ebp),%xmm2
- .byte 15,89,215 // mulps %xmm7,%xmm2
- .byte 15,40,101,88 // movaps 0x58(%ebp),%xmm4
- .byte 15,92,220 // subps %xmm4,%xmm3
- .byte 15,89,223 // mulps %xmm7,%xmm3
- .byte 139,77,8 // mov 0x8(%ebp),%ecx
- .byte 139,85,16 // mov 0x10(%ebp),%edx
- .byte 139,117,20 // mov 0x14(%ebp),%esi
- .byte 139,125,24 // mov 0x18(%ebp),%edi
- .byte 15,88,198 // addps %xmm6,%xmm0
- .byte 15,88,205 // addps %xmm5,%xmm1
- .byte 15,40,125,72 // movaps 0x48(%ebp),%xmm7
- .byte 15,88,215 // addps %xmm7,%xmm2
- .byte 15,88,220 // addps %xmm4,%xmm3
- .byte 141,88,8 // lea 0x8(%eax),%ebx
- .byte 15,41,100,36,80 // movaps %xmm4,0x50(%esp)
- .byte 15,41,124,36,64 // movaps %xmm7,0x40(%esp)
- .byte 15,41,108,36,48 // movaps %xmm5,0x30(%esp)
- .byte 15,41,116,36,32 // movaps %xmm6,0x20(%esp)
- .byte 137,124,36,16 // mov %edi,0x10(%esp)
- .byte 137,116,36,12 // mov %esi,0xc(%esp)
- .byte 137,84,36,8 // mov %edx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,12,36 // mov %ecx,(%esp)
- .byte 255,80,4 // call *0x4(%eax)
- .byte 131,196,108 // add $0x6c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 139,69,8 // mov 0x8(%ebp),%eax
+ .byte 139,77,12 // mov 0xc(%ebp),%ecx
+ .byte 139,17 // mov (%ecx),%edx
+ .byte 243,15,16,34 // movss (%edx),%xmm4
+ .byte 15,198,228,0 // shufps $0x0,%xmm4,%xmm4
+ .byte 15,40,104,16 // movaps 0x10(%eax),%xmm5
+ .byte 15,40,112,32 // movaps 0x20(%eax),%xmm6
+ .byte 15,92,197 // subps %xmm5,%xmm0
+ .byte 15,89,196 // mulps %xmm4,%xmm0
+ .byte 15,88,197 // addps %xmm5,%xmm0
+ .byte 15,92,206 // subps %xmm6,%xmm1
+ .byte 15,89,204 // mulps %xmm4,%xmm1
+ .byte 15,88,206 // addps %xmm6,%xmm1
+ .byte 15,40,104,48 // movaps 0x30(%eax),%xmm5
+ .byte 15,92,213 // subps %xmm5,%xmm2
+ .byte 15,89,212 // mulps %xmm4,%xmm2
+ .byte 15,88,213 // addps %xmm5,%xmm2
+ .byte 15,40,104,64 // movaps 0x40(%eax),%xmm5
+ .byte 15,92,221 // subps %xmm5,%xmm3
+ .byte 15,89,220 // mulps %xmm4,%xmm3
+ .byte 15,88,221 // addps %xmm5,%xmm3
+ .byte 141,81,8 // lea 0x8(%ecx),%edx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 82 // push %edx
+ .byte 80 // push %eax
+ .byte 255,81,4 // call *0x4(%ecx)
+ .byte 131,196,24 // add $0x18,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -53004,84 +52048,72 @@ _sk_lerp_u8_sse2:
.byte 83 // push %ebx
.byte 87 // push %edi
.byte 86 // push %esi
- .byte 131,236,124 // sub $0x7c,%esp
- .byte 15,41,93,216 // movaps %xmm3,-0x28(%ebp)
- .byte 232,0,0,0,0 // call 33ec <_sk_lerp_u8_sse2+0x12>
- .byte 95 // pop %edi
- .byte 15,40,109,40 // movaps 0x28(%ebp),%xmm5
+ .byte 131,236,12 // sub $0xc,%esp
+ .byte 232,0,0,0,0 // call 275c <_sk_lerp_u8_sse2+0xe>
+ .byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
- .byte 139,48 // mov (%eax),%esi
- .byte 139,86,4 // mov 0x4(%esi),%edx
- .byte 15,175,85,20 // imul 0x14(%ebp),%edx
- .byte 3,22 // add (%esi),%edx
- .byte 139,93,24 // mov 0x18(%ebp),%ebx
+ .byte 139,77,8 // mov 0x8(%ebp),%ecx
+ .byte 139,56 // mov (%eax),%edi
+ .byte 139,119,4 // mov 0x4(%edi),%esi
+ .byte 15,175,113,4 // imul 0x4(%ecx),%esi
+ .byte 3,55 // add (%edi),%esi
+ .byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
- .byte 139,117,16 // mov 0x10(%ebp),%esi
- .byte 15,133,146,0,0,0 // jne 349f <_sk_lerp_u8_sse2+0xc5>
- .byte 102,15,110,36,50 // movd (%edx,%esi,1),%xmm4
+ .byte 139,57 // mov (%ecx),%edi
+ .byte 117,102 // jne 27dd <_sk_lerp_u8_sse2+0x8f>
+ .byte 102,15,110,36,62 // movd (%esi,%edi,1),%xmm4
.byte 102,15,96,224 // punpcklbw %xmm0,%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
- .byte 102,15,219,167,180,98,0,0 // pand 0x62b4(%edi),%xmm4
+ .byte 102,15,219,162,84,76,0,0 // pand 0x4c54(%edx),%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,167,196,98,0,0 // mulps 0x62c4(%edi),%xmm4
+ .byte 15,89,162,100,76,0,0 // mulps 0x4c64(%edx),%xmm4
+ .byte 15,40,105,16 // movaps 0x10(%ecx),%xmm5
+ .byte 15,40,113,32 // movaps 0x20(%ecx),%xmm6
.byte 15,92,197 // subps %xmm5,%xmm0
.byte 15,89,196 // mulps %xmm4,%xmm0
- .byte 15,40,117,56 // movaps 0x38(%ebp),%xmm6
+ .byte 15,88,197 // addps %xmm5,%xmm0
.byte 15,92,206 // subps %xmm6,%xmm1
.byte 15,89,204 // mulps %xmm4,%xmm1
- .byte 15,40,125,72 // movaps 0x48(%ebp),%xmm7
- .byte 15,92,215 // subps %xmm7,%xmm2
+ .byte 15,88,206 // addps %xmm6,%xmm1
+ .byte 15,40,105,48 // movaps 0x30(%ecx),%xmm5
+ .byte 15,92,213 // subps %xmm5,%xmm2
.byte 15,89,212 // mulps %xmm4,%xmm2
- .byte 15,40,109,88 // movaps 0x58(%ebp),%xmm5
- .byte 15,40,93,216 // movaps -0x28(%ebp),%xmm3
+ .byte 15,88,213 // addps %xmm5,%xmm2
+ .byte 15,40,105,64 // movaps 0x40(%ecx),%xmm5
.byte 15,92,221 // subps %xmm5,%xmm3
.byte 15,89,220 // mulps %xmm4,%xmm3
- .byte 15,40,101,40 // movaps 0x28(%ebp),%xmm4
- .byte 15,88,196 // addps %xmm4,%xmm0
- .byte 15,88,206 // addps %xmm6,%xmm1
- .byte 15,88,215 // addps %xmm7,%xmm2
.byte 15,88,221 // addps %xmm5,%xmm3
- .byte 141,72,8 // lea 0x8(%eax),%ecx
- .byte 15,41,108,36,80 // movaps %xmm5,0x50(%esp)
- .byte 15,41,124,36,64 // movaps %xmm7,0x40(%esp)
- .byte 15,41,116,36,48 // movaps %xmm6,0x30(%esp)
- .byte 15,41,100,36,32 // movaps %xmm4,0x20(%esp)
- .byte 137,92,36,16 // mov %ebx,0x10(%esp)
- .byte 139,85,20 // mov 0x14(%ebp),%edx
- .byte 137,84,36,12 // mov %edx,0xc(%esp)
- .byte 137,116,36,8 // mov %esi,0x8(%esp)
- .byte 137,76,36,4 // mov %ecx,0x4(%esp)
- .byte 139,77,8 // mov 0x8(%ebp),%ecx
- .byte 137,12,36 // mov %ecx,(%esp)
+ .byte 141,80,8 // lea 0x8(%eax),%edx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 82 // push %edx
+ .byte 81 // push %ecx
.byte 255,80,4 // call *0x4(%eax)
- .byte 131,196,124 // add $0x7c,%esp
+ .byte 131,196,28 // add $0x1c,%esp
.byte 94 // pop %esi
.byte 95 // pop %edi
.byte 91 // pop %ebx
.byte 93 // pop %ebp
.byte 195 // ret
- .byte 137,217 // mov %ebx,%ecx
- .byte 128,225,3 // and $0x3,%cl
- .byte 128,249,1 // cmp $0x1,%cl
- .byte 116,61 // je 34e6 <_sk_lerp_u8_sse2+0x10c>
+ .byte 128,227,3 // and $0x3,%bl
+ .byte 128,251,1 // cmp $0x1,%bl
+ .byte 116,53 // je 281a <_sk_lerp_u8_sse2+0xcc>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
- .byte 128,249,2 // cmp $0x2,%cl
- .byte 116,23 // je 34c9 <_sk_lerp_u8_sse2+0xef>
- .byte 128,249,3 // cmp $0x3,%cl
- .byte 15,133,95,255,255,255 // jne 341a <_sk_lerp_u8_sse2+0x40>
- .byte 15,182,76,50,2 // movzbl 0x2(%edx,%esi,1),%ecx
- .byte 102,15,110,225 // movd %ecx,%xmm4
+ .byte 128,251,2 // cmp $0x2,%bl
+ .byte 116,19 // je 2801 <_sk_lerp_u8_sse2+0xb3>
+ .byte 128,251,3 // cmp $0x3,%bl
+ .byte 117,145 // jne 2784 <_sk_lerp_u8_sse2+0x36>
+ .byte 15,182,92,62,2 // movzbl 0x2(%esi,%edi,1),%ebx
+ .byte 102,15,110,227 // movd %ebx,%xmm4
.byte 102,15,112,228,69 // pshufd $0x45,%xmm4,%xmm4
- .byte 15,183,12,50 // movzwl (%edx,%esi,1),%ecx
- .byte 102,15,110,233 // movd %ecx,%xmm5
+ .byte 15,183,52,62 // movzwl (%esi,%edi,1),%esi
+ .byte 102,15,110,238 // movd %esi,%xmm5
.byte 102,15,96,232 // punpcklbw %xmm0,%xmm5
.byte 102,15,97,232 // punpcklwd %xmm0,%xmm5
.byte 242,15,16,229 // movsd %xmm5,%xmm4
- .byte 15,40,109,40 // movaps 0x28(%ebp),%xmm5
- .byte 233,52,255,255,255 // jmp 341a <_sk_lerp_u8_sse2+0x40>
- .byte 15,182,12,50 // movzbl (%edx,%esi,1),%ecx
- .byte 102,15,110,225 // movd %ecx,%xmm4
- .byte 233,39,255,255,255 // jmp 341a <_sk_lerp_u8_sse2+0x40>
+ .byte 233,106,255,255,255 // jmp 2784 <_sk_lerp_u8_sse2+0x36>
+ .byte 15,182,52,62 // movzbl (%esi,%edi,1),%esi
+ .byte 102,15,110,230 // movd %esi,%xmm4
+ .byte 233,93,255,255,255 // jmp 2784 <_sk_lerp_u8_sse2+0x36>
HIDDEN _sk_lerp_565_sse2
.globl _sk_lerp_565_sse2
@@ -53092,96 +52124,85 @@ _sk_lerp_565_sse2:
.byte 83 // push %ebx
.byte 87 // push %edi
.byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 232,0,0,0,0 // call 3501 <_sk_lerp_565_sse2+0xe>
- .byte 95 // pop %edi
+ .byte 131,236,12 // sub $0xc,%esp
+ .byte 232,0,0,0,0 // call 2835 <_sk_lerp_565_sse2+0xe>
+ .byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
- .byte 139,48 // mov (%eax),%esi
- .byte 139,86,4 // mov 0x4(%esi),%edx
- .byte 15,175,85,20 // imul 0x14(%ebp),%edx
- .byte 1,210 // add %edx,%edx
- .byte 3,22 // add (%esi),%edx
- .byte 139,93,24 // mov 0x18(%ebp),%ebx
+ .byte 139,77,8 // mov 0x8(%ebp),%ecx
+ .byte 139,56 // mov (%eax),%edi
+ .byte 139,119,4 // mov 0x4(%edi),%esi
+ .byte 15,175,113,4 // imul 0x4(%ecx),%esi
+ .byte 1,246 // add %esi,%esi
+ .byte 3,55 // add (%edi),%esi
+ .byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
- .byte 139,117,16 // mov 0x10(%ebp),%esi
- .byte 15,133,215,0,0,0 // jne 35f7 <_sk_lerp_565_sse2+0x104>
- .byte 243,15,126,52,114 // movq (%edx,%esi,2),%xmm6
+ .byte 139,57 // mov (%ecx),%edi
+ .byte 15,133,163,0,0,0 // jne 28f9 <_sk_lerp_565_sse2+0xd2>
+ .byte 243,15,126,52,126 // movq (%esi,%edi,2),%xmm6
.byte 102,15,97,240 // punpcklwd %xmm0,%xmm6
- .byte 102,15,111,167,191,97,0,0 // movdqa 0x61bf(%edi),%xmm4
+ .byte 102,15,111,162,155,75,0,0 // movdqa 0x4b9b(%edx),%xmm4
.byte 102,15,219,230 // pand %xmm6,%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,167,207,97,0,0 // mulps 0x61cf(%edi),%xmm4
- .byte 102,15,111,191,223,97,0,0 // movdqa 0x61df(%edi),%xmm7
- .byte 102,15,219,254 // pand %xmm6,%xmm7
- .byte 15,91,255 // cvtdq2ps %xmm7,%xmm7
- .byte 15,89,191,239,97,0,0 // mulps 0x61ef(%edi),%xmm7
- .byte 102,15,219,183,255,97,0,0 // pand 0x61ff(%edi),%xmm6
+ .byte 15,89,162,171,75,0,0 // mulps 0x4bab(%edx),%xmm4
+ .byte 102,15,111,170,187,75,0,0 // movdqa 0x4bbb(%edx),%xmm5
+ .byte 102,15,219,238 // pand %xmm6,%xmm5
+ .byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
+ .byte 15,89,170,203,75,0,0 // mulps 0x4bcb(%edx),%xmm5
+ .byte 102,15,219,178,219,75,0,0 // pand 0x4bdb(%edx),%xmm6
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
- .byte 15,89,183,15,98,0,0 // mulps 0x620f(%edi),%xmm6
- .byte 15,40,109,40 // movaps 0x28(%ebp),%xmm5
- .byte 15,92,197 // subps %xmm5,%xmm0
+ .byte 15,89,178,235,75,0,0 // mulps 0x4beb(%edx),%xmm6
+ .byte 15,40,121,16 // movaps 0x10(%ecx),%xmm7
+ .byte 15,92,199 // subps %xmm7,%xmm0
.byte 15,89,196 // mulps %xmm4,%xmm0
- .byte 15,40,109,56 // movaps 0x38(%ebp),%xmm5
- .byte 15,92,205 // subps %xmm5,%xmm1
- .byte 15,89,207 // mulps %xmm7,%xmm1
- .byte 15,40,109,72 // movaps 0x48(%ebp),%xmm5
- .byte 15,92,213 // subps %xmm5,%xmm2
+ .byte 15,88,199 // addps %xmm7,%xmm0
+ .byte 15,40,121,32 // movaps 0x20(%ecx),%xmm7
+ .byte 15,92,207 // subps %xmm7,%xmm1
+ .byte 15,89,205 // mulps %xmm5,%xmm1
+ .byte 15,88,207 // addps %xmm7,%xmm1
+ .byte 15,40,121,48 // movaps 0x30(%ecx),%xmm7
+ .byte 15,92,215 // subps %xmm7,%xmm2
.byte 15,89,214 // mulps %xmm6,%xmm2
- .byte 15,40,109,88 // movaps 0x58(%ebp),%xmm5
- .byte 15,92,221 // subps %xmm5,%xmm3
+ .byte 15,88,215 // addps %xmm7,%xmm2
+ .byte 15,40,121,64 // movaps 0x40(%ecx),%xmm7
+ .byte 15,92,223 // subps %xmm7,%xmm3
.byte 15,89,227 // mulps %xmm3,%xmm4
- .byte 15,89,251 // mulps %xmm3,%xmm7
+ .byte 15,89,235 // mulps %xmm3,%xmm5
.byte 15,89,222 // mulps %xmm6,%xmm3
- .byte 15,88,253 // addps %xmm5,%xmm7
- .byte 15,88,221 // addps %xmm5,%xmm3
- .byte 15,95,251 // maxps %xmm3,%xmm7
- .byte 15,88,229 // addps %xmm5,%xmm4
- .byte 15,95,231 // maxps %xmm7,%xmm4
- .byte 15,40,93,40 // movaps 0x28(%ebp),%xmm3
- .byte 15,88,195 // addps %xmm3,%xmm0
- .byte 15,40,117,56 // movaps 0x38(%ebp),%xmm6
- .byte 15,88,206 // addps %xmm6,%xmm1
- .byte 15,40,125,72 // movaps 0x48(%ebp),%xmm7
- .byte 15,88,215 // addps %xmm7,%xmm2
- .byte 141,72,8 // lea 0x8(%eax),%ecx
- .byte 15,41,108,36,80 // movaps %xmm5,0x50(%esp)
- .byte 15,41,124,36,64 // movaps %xmm7,0x40(%esp)
- .byte 15,41,116,36,48 // movaps %xmm6,0x30(%esp)
- .byte 15,41,92,36,32 // movaps %xmm3,0x20(%esp)
- .byte 137,92,36,16 // mov %ebx,0x10(%esp)
- .byte 139,85,20 // mov 0x14(%ebp),%edx
- .byte 137,84,36,12 // mov %edx,0xc(%esp)
- .byte 137,116,36,8 // mov %esi,0x8(%esp)
- .byte 137,76,36,4 // mov %ecx,0x4(%esp)
- .byte 139,77,8 // mov 0x8(%ebp),%ecx
- .byte 137,12,36 // mov %ecx,(%esp)
+ .byte 15,88,231 // addps %xmm7,%xmm4
+ .byte 15,88,239 // addps %xmm7,%xmm5
+ .byte 15,88,223 // addps %xmm7,%xmm3
+ .byte 15,95,235 // maxps %xmm3,%xmm5
+ .byte 15,95,229 // maxps %xmm5,%xmm4
+ .byte 141,80,8 // lea 0x8(%eax),%edx
+ .byte 131,236,8 // sub $0x8,%esp
.byte 15,40,220 // movaps %xmm4,%xmm3
+ .byte 82 // push %edx
+ .byte 81 // push %ecx
.byte 255,80,4 // call *0x4(%eax)
- .byte 131,196,108 // add $0x6c,%esp
+ .byte 131,196,28 // add $0x1c,%esp
.byte 94 // pop %esi
.byte 95 // pop %edi
.byte 91 // pop %ebx
.byte 93 // pop %ebp
.byte 195 // ret
- .byte 137,217 // mov %ebx,%ecx
- .byte 128,225,3 // and $0x3,%cl
- .byte 128,249,1 // cmp $0x1,%cl
- .byte 116,50 // je 3633 <_sk_lerp_565_sse2+0x140>
+ .byte 128,227,3 // and $0x3,%bl
+ .byte 128,251,1 // cmp $0x1,%bl
+ .byte 116,50 // je 2933 <_sk_lerp_565_sse2+0x10c>
.byte 102,15,239,246 // pxor %xmm6,%xmm6
- .byte 128,249,2 // cmp $0x2,%cl
- .byte 116,23 // je 3621 <_sk_lerp_565_sse2+0x12e>
- .byte 128,249,3 // cmp $0x3,%cl
- .byte 15,133,22,255,255,255 // jne 3529 <_sk_lerp_565_sse2+0x36>
- .byte 15,183,76,114,4 // movzwl 0x4(%edx,%esi,2),%ecx
- .byte 102,15,110,225 // movd %ecx,%xmm4
+ .byte 128,251,2 // cmp $0x2,%bl
+ .byte 116,23 // je 2921 <_sk_lerp_565_sse2+0xfa>
+ .byte 128,251,3 // cmp $0x3,%bl
+ .byte 15,133,76,255,255,255 // jne 285f <_sk_lerp_565_sse2+0x38>
+ .byte 15,183,92,126,4 // movzwl 0x4(%esi,%edi,2),%ebx
+ .byte 102,15,110,227 // movd %ebx,%xmm4
.byte 102,15,112,244,69 // pshufd $0x45,%xmm4,%xmm6
- .byte 102,15,110,36,114 // movd (%edx,%esi,2),%xmm4
+ .byte 102,15,110,36,126 // movd (%esi,%edi,2),%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
.byte 242,15,16,244 // movsd %xmm4,%xmm6
- .byte 233,246,254,255,255 // jmp 3529 <_sk_lerp_565_sse2+0x36>
- .byte 15,183,12,114 // movzwl (%edx,%esi,2),%ecx
- .byte 102,15,110,241 // movd %ecx,%xmm6
- .byte 233,233,254,255,255 // jmp 3529 <_sk_lerp_565_sse2+0x36>
+ .byte 233,44,255,255,255 // jmp 285f <_sk_lerp_565_sse2+0x38>
+ .byte 15,183,52,126 // movzwl (%esi,%edi,2),%esi
+ .byte 102,15,110,246 // movd %esi,%xmm6
+ .byte 233,31,255,255,255 // jmp 285f <_sk_lerp_565_sse2+0x38>
HIDDEN _sk_load_tables_sse2
.globl _sk_load_tables_sse2
@@ -53192,33 +52213,34 @@ _sk_load_tables_sse2:
.byte 83 // push %ebx
.byte 87 // push %edi
.byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 232,0,0,0,0 // call 364e <_sk_load_tables_sse2+0xe>
- .byte 94 // pop %esi
- .byte 139,69,24 // mov 0x18(%ebp),%eax
- .byte 139,93,16 // mov 0x10(%ebp),%ebx
- .byte 139,77,12 // mov 0xc(%ebp),%ecx
+ .byte 131,236,12 // sub $0xc,%esp
+ .byte 232,0,0,0,0 // call 294e <_sk_load_tables_sse2+0xe>
+ .byte 90 // pop %edx
+ .byte 139,117,12 // mov 0xc(%ebp),%esi
+ .byte 139,77,8 // mov 0x8(%ebp),%ecx
+ .byte 139,57 // mov (%ecx),%edi
+ .byte 139,65,8 // mov 0x8(%ecx),%eax
.byte 133,192 // test %eax,%eax
- .byte 139,17 // mov (%ecx),%edx
- .byte 139,58 // mov (%edx),%edi
- .byte 15,133,75,1,0,0 // jne 37af <_sk_load_tables_sse2+0x16f>
- .byte 243,15,111,28,159 // movdqu (%edi,%ebx,4),%xmm3
- .byte 102,15,111,150,210,96,0,0 // movdqa 0x60d2(%esi),%xmm2
+ .byte 139,54 // mov (%esi),%esi
+ .byte 139,30 // mov (%esi),%ebx
+ .byte 15,133,19,1,0,0 // jne 2a79 <_sk_load_tables_sse2+0x139>
+ .byte 243,15,111,28,187 // movdqu (%ebx,%edi,4),%xmm3
+ .byte 102,15,111,146,226,74,0,0 // movdqa 0x4ae2(%edx),%xmm2
.byte 102,15,111,195 // movdqa %xmm3,%xmm0
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 102,15,112,200,229 // pshufd $0xe5,%xmm0,%xmm1
.byte 102,15,112,224,231 // pshufd $0xe7,%xmm0,%xmm4
- .byte 102,15,126,231 // movd %xmm4,%edi
- .byte 139,74,4 // mov 0x4(%edx),%ecx
- .byte 243,15,16,36,185 // movss (%ecx,%edi,4),%xmm4
- .byte 102,15,126,207 // movd %xmm1,%edi
- .byte 243,15,16,44,185 // movss (%ecx,%edi,4),%xmm5
- .byte 102,15,126,199 // movd %xmm0,%edi
+ .byte 102,15,126,224 // movd %xmm4,%eax
+ .byte 139,126,4 // mov 0x4(%esi),%edi
+ .byte 243,15,16,36,135 // movss (%edi,%eax,4),%xmm4
+ .byte 102,15,126,200 // movd %xmm1,%eax
+ .byte 243,15,16,44,135 // movss (%edi,%eax,4),%xmm5
+ .byte 102,15,126,192 // movd %xmm0,%eax
.byte 102,15,112,200,78 // pshufd $0x4e,%xmm0,%xmm1
- .byte 243,15,16,4,185 // movss (%ecx,%edi,4),%xmm0
- .byte 102,15,126,207 // movd %xmm1,%edi
- .byte 243,15,16,12,185 // movss (%ecx,%edi,4),%xmm1
- .byte 139,74,8 // mov 0x8(%edx),%ecx
+ .byte 243,15,16,4,135 // movss (%edi,%eax,4),%xmm0
+ .byte 102,15,126,200 // movd %xmm1,%eax
+ .byte 243,15,16,12,135 // movss (%edi,%eax,4),%xmm1
+ .byte 139,70,8 // mov 0x8(%esi),%eax
.byte 15,20,236 // unpcklps %xmm4,%xmm5
.byte 15,20,193 // unpcklps %xmm1,%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
@@ -53227,79 +52249,66 @@ _sk_load_tables_sse2:
.byte 102,15,112,225,229 // pshufd $0xe5,%xmm1,%xmm4
.byte 102,15,112,241,231 // pshufd $0xe7,%xmm1,%xmm6
.byte 102,15,126,247 // movd %xmm6,%edi
- .byte 243,15,16,52,185 // movss (%ecx,%edi,4),%xmm6
+ .byte 243,15,16,52,184 // movss (%eax,%edi,4),%xmm6
.byte 102,15,126,231 // movd %xmm4,%edi
- .byte 243,15,16,36,185 // movss (%ecx,%edi,4),%xmm4
+ .byte 243,15,16,36,184 // movss (%eax,%edi,4),%xmm4
.byte 102,15,126,207 // movd %xmm1,%edi
.byte 102,15,112,249,78 // pshufd $0x4e,%xmm1,%xmm7
- .byte 243,15,16,12,185 // movss (%ecx,%edi,4),%xmm1
+ .byte 243,15,16,12,184 // movss (%eax,%edi,4),%xmm1
.byte 102,15,126,255 // movd %xmm7,%edi
- .byte 243,15,16,60,185 // movss (%ecx,%edi,4),%xmm7
+ .byte 243,15,16,60,184 // movss (%eax,%edi,4),%xmm7
.byte 15,20,197 // unpcklps %xmm5,%xmm0
.byte 15,20,230 // unpcklps %xmm6,%xmm4
.byte 15,20,207 // unpcklps %xmm7,%xmm1
- .byte 139,74,12 // mov 0xc(%edx),%ecx
+ .byte 139,70,12 // mov 0xc(%esi),%eax
.byte 102,15,111,235 // movdqa %xmm3,%xmm5
.byte 102,15,114,213,16 // psrld $0x10,%xmm5
.byte 102,15,219,234 // pand %xmm2,%xmm5
.byte 102,15,112,213,229 // pshufd $0xe5,%xmm5,%xmm2
.byte 102,15,112,245,231 // pshufd $0xe7,%xmm5,%xmm6
- .byte 102,15,126,242 // movd %xmm6,%edx
- .byte 243,15,16,52,145 // movss (%ecx,%edx,4),%xmm6
- .byte 102,15,126,210 // movd %xmm2,%edx
- .byte 243,15,16,60,145 // movss (%ecx,%edx,4),%xmm7
- .byte 102,15,126,234 // movd %xmm5,%edx
+ .byte 102,15,126,246 // movd %xmm6,%esi
+ .byte 243,15,16,52,176 // movss (%eax,%esi,4),%xmm6
+ .byte 102,15,126,214 // movd %xmm2,%esi
+ .byte 243,15,16,60,176 // movss (%eax,%esi,4),%xmm7
+ .byte 102,15,126,238 // movd %xmm5,%esi
.byte 102,15,112,237,78 // pshufd $0x4e,%xmm5,%xmm5
- .byte 243,15,16,20,145 // movss (%ecx,%edx,4),%xmm2
- .byte 102,15,126,234 // movd %xmm5,%edx
- .byte 243,15,16,44,145 // movss (%ecx,%edx,4),%xmm5
+ .byte 243,15,16,20,176 // movss (%eax,%esi,4),%xmm2
+ .byte 102,15,126,238 // movd %xmm5,%esi
+ .byte 243,15,16,44,176 // movss (%eax,%esi,4),%xmm5
.byte 15,20,204 // unpcklps %xmm4,%xmm1
.byte 15,20,254 // unpcklps %xmm6,%xmm7
.byte 15,20,213 // unpcklps %xmm5,%xmm2
.byte 15,20,215 // unpcklps %xmm7,%xmm2
.byte 102,15,114,211,24 // psrld $0x18,%xmm3
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,158,226,96,0,0 // mulps 0x60e2(%esi),%xmm3
- .byte 139,77,12 // mov 0xc(%ebp),%ecx
- .byte 137,206 // mov %ecx,%esi
- .byte 141,78,8 // lea 0x8(%esi),%ecx
- .byte 15,40,101,88 // movaps 0x58(%ebp),%xmm4
- .byte 15,41,100,36,80 // movaps %xmm4,0x50(%esp)
- .byte 15,40,101,72 // movaps 0x48(%ebp),%xmm4
- .byte 15,41,100,36,64 // movaps %xmm4,0x40(%esp)
- .byte 15,40,101,56 // movaps 0x38(%ebp),%xmm4
- .byte 15,41,100,36,48 // movaps %xmm4,0x30(%esp)
- .byte 15,40,101,40 // movaps 0x28(%ebp),%xmm4
- .byte 15,41,100,36,32 // movaps %xmm4,0x20(%esp)
- .byte 137,68,36,16 // mov %eax,0x10(%esp)
- .byte 139,85,20 // mov 0x14(%ebp),%edx
- .byte 137,84,36,12 // mov %edx,0xc(%esp)
- .byte 137,92,36,8 // mov %ebx,0x8(%esp)
- .byte 137,76,36,4 // mov %ecx,0x4(%esp)
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 137,4,36 // mov %eax,(%esp)
- .byte 255,86,4 // call *0x4(%esi)
- .byte 131,196,108 // add $0x6c,%esp
+ .byte 15,89,154,242,74,0,0 // mulps 0x4af2(%edx),%xmm3
+ .byte 139,69,12 // mov 0xc(%ebp),%eax
+ .byte 137,194 // mov %eax,%edx
+ .byte 141,66,8 // lea 0x8(%edx),%eax
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 80 // push %eax
+ .byte 81 // push %ecx
+ .byte 255,82,4 // call *0x4(%edx)
+ .byte 131,196,28 // add $0x1c,%esp
.byte 94 // pop %esi
.byte 95 // pop %edi
.byte 91 // pop %ebx
.byte 93 // pop %ebp
.byte 195 // ret
- .byte 137,193 // mov %eax,%ecx
- .byte 128,225,3 // and $0x3,%cl
- .byte 128,249,1 // cmp $0x1,%cl
- .byte 116,39 // je 37e0 <_sk_load_tables_sse2+0x1a0>
+ .byte 36,3 // and $0x3,%al
+ .byte 60,1 // cmp $0x1,%al
+ .byte 116,37 // je 2aa4 <_sk_load_tables_sse2+0x164>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
- .byte 128,249,2 // cmp $0x2,%cl
- .byte 116,20 // je 37d6 <_sk_load_tables_sse2+0x196>
- .byte 128,249,3 // cmp $0x3,%cl
- .byte 15,133,158,254,255,255 // jne 3669 <_sk_load_tables_sse2+0x29>
- .byte 102,15,110,68,159,8 // movd 0x8(%edi,%ebx,4),%xmm0
+ .byte 60,2 // cmp $0x2,%al
+ .byte 116,19 // je 2a9a <_sk_load_tables_sse2+0x15a>
+ .byte 60,3 // cmp $0x3,%al
+ .byte 15,133,220,254,255,255 // jne 296b <_sk_load_tables_sse2+0x2b>
+ .byte 102,15,110,68,187,8 // movd 0x8(%ebx,%edi,4),%xmm0
.byte 102,15,112,216,69 // pshufd $0x45,%xmm0,%xmm3
- .byte 102,15,18,28,159 // movlpd (%edi,%ebx,4),%xmm3
- .byte 233,137,254,255,255 // jmp 3669 <_sk_load_tables_sse2+0x29>
- .byte 102,15,110,28,159 // movd (%edi,%ebx,4),%xmm3
- .byte 233,127,254,255,255 // jmp 3669 <_sk_load_tables_sse2+0x29>
+ .byte 102,15,18,28,187 // movlpd (%ebx,%edi,4),%xmm3
+ .byte 233,199,254,255,255 // jmp 296b <_sk_load_tables_sse2+0x2b>
+ .byte 102,15,110,28,187 // movd (%ebx,%edi,4),%xmm3
+ .byte 233,189,254,255,255 // jmp 296b <_sk_load_tables_sse2+0x2b>
HIDDEN _sk_load_tables_u16_be_sse2
.globl _sk_load_tables_u16_be_sse2
@@ -53310,19 +52319,21 @@ _sk_load_tables_u16_be_sse2:
.byte 83 // push %ebx
.byte 87 // push %edi
.byte 86 // push %esi
- .byte 129,236,140,0,0,0 // sub $0x8c,%esp
- .byte 232,0,0,0,0 // call 37fb <_sk_load_tables_u16_be_sse2+0x11>
- .byte 95 // pop %edi
- .byte 139,85,16 // mov 0x10(%ebp),%edx
- .byte 139,69,12 // mov 0xc(%ebp),%eax
- .byte 131,125,24,0 // cmpl $0x0,0x18(%ebp)
+ .byte 131,236,44 // sub $0x2c,%esp
+ .byte 232,0,0,0,0 // call 2abc <_sk_load_tables_u16_be_sse2+0xe>
+ .byte 90 // pop %edx
+ .byte 139,77,12 // mov 0xc(%ebp),%ecx
+ .byte 139,69,8 // mov 0x8(%ebp),%eax
.byte 139,24 // mov (%eax),%ebx
- .byte 139,11 // mov (%ebx),%ecx
- .byte 141,52,149,0,0,0,0 // lea 0x0(,%edx,4),%esi
- .byte 186,255,0,255,0 // mov $0xff00ff,%edx
- .byte 15,133,229,1,0,0 // jne 3a01 <_sk_load_tables_u16_be_sse2+0x217>
- .byte 102,15,16,4,113 // movupd (%ecx,%esi,2),%xmm0
- .byte 243,15,111,76,113,16 // movdqu 0x10(%ecx,%esi,2),%xmm1
+ .byte 139,64,8 // mov 0x8(%eax),%eax
+ .byte 193,227,2 // shl $0x2,%ebx
+ .byte 133,192 // test %eax,%eax
+ .byte 139,57 // mov (%ecx),%edi
+ .byte 139,15 // mov (%edi),%ecx
+ .byte 190,255,0,255,0 // mov $0xff00ff,%esi
+ .byte 15,133,166,1,0,0 // jne 2c82 <_sk_load_tables_u16_be_sse2+0x1d4>
+ .byte 102,15,16,4,89 // movupd (%ecx,%ebx,2),%xmm0
+ .byte 243,15,111,76,89,16 // movdqu 0x10(%ecx,%ebx,2),%xmm1
.byte 102,15,40,216 // movapd %xmm0,%xmm3
.byte 102,15,97,217 // punpcklwd %xmm1,%xmm3
.byte 102,15,105,193 // punpckhwd %xmm1,%xmm0
@@ -53330,64 +52341,64 @@ _sk_load_tables_u16_be_sse2:
.byte 102,15,97,208 // punpcklwd %xmm0,%xmm2
.byte 102,15,105,216 // punpckhwd %xmm0,%xmm3
.byte 102,15,112,194,229 // pshufd $0xe5,%xmm2,%xmm0
- .byte 102,15,126,193 // movd %xmm0,%ecx
- .byte 102,15,126,214 // movd %xmm2,%esi
+ .byte 102,15,126,192 // movd %xmm0,%eax
+ .byte 102,15,126,209 // movd %xmm2,%ecx
.byte 102,15,112,202,78 // pshufd $0x4e,%xmm2,%xmm1
.byte 102,15,112,234,231 // pshufd $0xe7,%xmm2,%xmm5
- .byte 33,214 // and %edx,%esi
- .byte 137,117,216 // mov %esi,-0x28(%ebp)
- .byte 33,209 // and %edx,%ecx
- .byte 137,77,220 // mov %ecx,-0x24(%ebp)
+ .byte 33,241 // and %esi,%ecx
+ .byte 137,77,216 // mov %ecx,-0x28(%ebp)
+ .byte 33,240 // and %esi,%eax
+ .byte 137,69,220 // mov %eax,-0x24(%ebp)
.byte 243,15,126,69,216 // movq -0x28(%ebp),%xmm0
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 102,15,97,194 // punpcklwd %xmm2,%xmm0
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 102,15,112,208,229 // pshufd $0xe5,%xmm0,%xmm2
.byte 102,15,112,240,231 // pshufd $0xe7,%xmm0,%xmm6
- .byte 102,15,126,241 // movd %xmm6,%ecx
- .byte 139,115,4 // mov 0x4(%ebx),%esi
- .byte 243,15,16,52,142 // movss (%esi,%ecx,4),%xmm6
- .byte 102,15,126,209 // movd %xmm2,%ecx
- .byte 243,15,16,20,142 // movss (%esi,%ecx,4),%xmm2
- .byte 102,15,126,193 // movd %xmm0,%ecx
+ .byte 102,15,126,240 // movd %xmm6,%eax
+ .byte 139,79,4 // mov 0x4(%edi),%ecx
+ .byte 243,15,16,52,129 // movss (%ecx,%eax,4),%xmm6
+ .byte 102,15,126,208 // movd %xmm2,%eax
+ .byte 243,15,16,20,129 // movss (%ecx,%eax,4),%xmm2
+ .byte 102,15,126,192 // movd %xmm0,%eax
.byte 102,15,112,248,78 // pshufd $0x4e,%xmm0,%xmm7
- .byte 243,15,16,4,142 // movss (%esi,%ecx,4),%xmm0
- .byte 102,15,126,249 // movd %xmm7,%ecx
- .byte 243,15,16,60,142 // movss (%esi,%ecx,4),%xmm7
- .byte 102,15,126,233 // movd %xmm5,%ecx
- .byte 139,115,8 // mov 0x8(%ebx),%esi
- .byte 33,209 // and %edx,%ecx
- .byte 137,77,228 // mov %ecx,-0x1c(%ebp)
- .byte 102,15,126,201 // movd %xmm1,%ecx
+ .byte 243,15,16,4,129 // movss (%ecx,%eax,4),%xmm0
+ .byte 102,15,126,248 // movd %xmm7,%eax
+ .byte 243,15,16,60,129 // movss (%ecx,%eax,4),%xmm7
+ .byte 102,15,126,232 // movd %xmm5,%eax
+ .byte 139,79,8 // mov 0x8(%edi),%ecx
+ .byte 33,240 // and %esi,%eax
+ .byte 137,69,228 // mov %eax,-0x1c(%ebp)
+ .byte 102,15,126,200 // movd %xmm1,%eax
.byte 102,15,112,203,229 // pshufd $0xe5,%xmm3,%xmm1
- .byte 33,209 // and %edx,%ecx
- .byte 137,77,224 // mov %ecx,-0x20(%ebp)
- .byte 102,15,126,201 // movd %xmm1,%ecx
+ .byte 33,240 // and %esi,%eax
+ .byte 137,69,224 // mov %eax,-0x20(%ebp)
+ .byte 102,15,126,200 // movd %xmm1,%eax
.byte 243,15,126,109,224 // movq -0x20(%ebp),%xmm5
.byte 102,15,97,236 // punpcklwd %xmm4,%xmm5
.byte 102,15,112,205,231 // pshufd $0xe7,%xmm5,%xmm1
- .byte 102,15,126,200 // movd %xmm1,%eax
- .byte 243,15,16,36,134 // movss (%esi,%eax,4),%xmm4
+ .byte 102,15,126,203 // movd %xmm1,%ebx
+ .byte 243,15,16,36,153 // movss (%ecx,%ebx,4),%xmm4
.byte 15,20,214 // unpcklps %xmm6,%xmm2
.byte 102,15,112,205,229 // pshufd $0xe5,%xmm5,%xmm1
- .byte 102,15,126,200 // movd %xmm1,%eax
- .byte 243,15,16,52,134 // movss (%esi,%eax,4),%xmm6
+ .byte 102,15,126,203 // movd %xmm1,%ebx
+ .byte 243,15,16,52,153 // movss (%ecx,%ebx,4),%xmm6
.byte 15,20,199 // unpcklps %xmm7,%xmm0
- .byte 102,15,126,232 // movd %xmm5,%eax
- .byte 243,15,16,12,134 // movss (%esi,%eax,4),%xmm1
+ .byte 102,15,126,235 // movd %xmm5,%ebx
+ .byte 243,15,16,12,153 // movss (%ecx,%ebx,4),%xmm1
.byte 102,15,112,237,78 // pshufd $0x4e,%xmm5,%xmm5
- .byte 102,15,126,232 // movd %xmm5,%eax
- .byte 243,15,16,44,134 // movss (%esi,%eax,4),%xmm5
- .byte 102,15,126,216 // movd %xmm3,%eax
- .byte 139,115,12 // mov 0xc(%ebx),%esi
- .byte 33,208 // and %edx,%eax
- .byte 137,69,232 // mov %eax,-0x18(%ebp)
- .byte 33,209 // and %edx,%ecx
+ .byte 102,15,126,235 // movd %xmm5,%ebx
+ .byte 243,15,16,44,153 // movss (%ecx,%ebx,4),%xmm5
+ .byte 102,15,126,217 // movd %xmm3,%ecx
+ .byte 139,127,12 // mov 0xc(%edi),%edi
+ .byte 33,241 // and %esi,%ecx
+ .byte 137,77,232 // mov %ecx,-0x18(%ebp)
+ .byte 33,240 // and %esi,%eax
.byte 15,20,194 // unpcklps %xmm2,%xmm0
.byte 15,20,244 // unpcklps %xmm4,%xmm6
.byte 15,20,205 // unpcklps %xmm5,%xmm1
.byte 15,20,206 // unpcklps %xmm6,%xmm1
- .byte 137,77,236 // mov %ecx,-0x14(%ebp)
+ .byte 137,69,236 // mov %eax,-0x14(%ebp)
.byte 243,15,126,85,232 // movq -0x18(%ebp),%xmm2
.byte 15,87,228 // xorps %xmm4,%xmm4
.byte 102,15,97,212 // punpcklwd %xmm4,%xmm2
@@ -53395,14 +52406,14 @@ _sk_load_tables_u16_be_sse2:
.byte 102,15,112,226,229 // pshufd $0xe5,%xmm2,%xmm4
.byte 102,15,112,234,231 // pshufd $0xe7,%xmm2,%xmm5
.byte 102,15,126,232 // movd %xmm5,%eax
- .byte 243,15,16,44,134 // movss (%esi,%eax,4),%xmm5
+ .byte 243,15,16,44,135 // movss (%edi,%eax,4),%xmm5
.byte 102,15,126,224 // movd %xmm4,%eax
- .byte 243,15,16,36,134 // movss (%esi,%eax,4),%xmm4
+ .byte 243,15,16,36,135 // movss (%edi,%eax,4),%xmm4
.byte 102,15,126,208 // movd %xmm2,%eax
.byte 102,15,112,242,78 // pshufd $0x4e,%xmm2,%xmm6
- .byte 243,15,16,20,134 // movss (%esi,%eax,4),%xmm2
+ .byte 243,15,16,20,135 // movss (%edi,%eax,4),%xmm2
.byte 102,15,126,240 // movd %xmm6,%eax
- .byte 243,15,16,52,134 // movss (%esi,%eax,4),%xmm6
+ .byte 243,15,16,52,135 // movss (%edi,%eax,4),%xmm6
.byte 15,20,229 // unpcklps %xmm5,%xmm4
.byte 15,20,214 // unpcklps %xmm6,%xmm2
.byte 15,20,212 // unpcklps %xmm4,%xmm2
@@ -53417,44 +52428,29 @@ _sk_load_tables_u16_be_sse2:
.byte 243,15,126,93,208 // movq -0x30(%ebp),%xmm3
.byte 102,15,97,223 // punpcklwd %xmm7,%xmm3
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,159,69,95,0,0 // mulps 0x5f45(%edi),%xmm3
+ .byte 15,89,154,148,73,0,0 // mulps 0x4994(%edx),%xmm3
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 137,193 // mov %eax,%ecx
.byte 141,65,8 // lea 0x8(%ecx),%eax
- .byte 15,40,101,88 // movaps 0x58(%ebp),%xmm4
- .byte 15,41,100,36,80 // movaps %xmm4,0x50(%esp)
- .byte 15,40,101,72 // movaps 0x48(%ebp),%xmm4
- .byte 15,41,100,36,64 // movaps %xmm4,0x40(%esp)
- .byte 15,40,101,56 // movaps 0x38(%ebp),%xmm4
- .byte 15,41,100,36,48 // movaps %xmm4,0x30(%esp)
- .byte 15,40,101,40 // movaps 0x28(%ebp),%xmm4
- .byte 15,41,100,36,32 // movaps %xmm4,0x20(%esp)
- .byte 139,85,24 // mov 0x18(%ebp),%edx
- .byte 137,84,36,16 // mov %edx,0x10(%esp)
- .byte 139,85,20 // mov 0x14(%ebp),%edx
- .byte 137,84,36,12 // mov %edx,0xc(%esp)
- .byte 139,85,16 // mov 0x10(%ebp),%edx
- .byte 137,84,36,8 // mov %edx,0x8(%esp)
- .byte 137,68,36,4 // mov %eax,0x4(%esp)
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 137,4,36 // mov %eax,(%esp)
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 80 // push %eax
+ .byte 255,117,8 // pushl 0x8(%ebp)
.byte 255,81,4 // call *0x4(%ecx)
- .byte 129,196,140,0,0,0 // add $0x8c,%esp
+ .byte 131,196,60 // add $0x3c,%esp
.byte 94 // pop %esi
.byte 95 // pop %edi
.byte 91 // pop %ebx
.byte 93 // pop %ebp
.byte 195 // ret
- .byte 242,15,16,4,113 // movsd (%ecx,%esi,2),%xmm0
+ .byte 242,15,16,4,89 // movsd (%ecx,%ebx,2),%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
- .byte 139,69,24 // mov 0x18(%ebp),%eax
.byte 131,248,1 // cmp $0x1,%eax
- .byte 15,132,17,254,255,255 // je 3827 <_sk_load_tables_u16_be_sse2+0x3d>
- .byte 102,15,22,68,113,8 // movhpd 0x8(%ecx,%esi,2),%xmm0
+ .byte 15,132,83,254,255,255 // je 2ae7 <_sk_load_tables_u16_be_sse2+0x39>
+ .byte 102,15,22,68,89,8 // movhpd 0x8(%ecx,%ebx,2),%xmm0
.byte 131,248,3 // cmp $0x3,%eax
- .byte 15,130,2,254,255,255 // jb 3827 <_sk_load_tables_u16_be_sse2+0x3d>
- .byte 243,15,126,76,113,16 // movq 0x10(%ecx,%esi,2),%xmm1
- .byte 233,247,253,255,255 // jmp 3827 <_sk_load_tables_u16_be_sse2+0x3d>
+ .byte 15,130,68,254,255,255 // jb 2ae7 <_sk_load_tables_u16_be_sse2+0x39>
+ .byte 243,15,126,76,89,16 // movq 0x10(%ecx,%ebx,2),%xmm1
+ .byte 233,57,254,255,255 // jmp 2ae7 <_sk_load_tables_u16_be_sse2+0x39>
HIDDEN _sk_load_tables_rgb_u16_be_sse2
.globl _sk_load_tables_rgb_u16_be_sse2
@@ -53465,20 +52461,21 @@ _sk_load_tables_rgb_u16_be_sse2:
.byte 83 // push %ebx
.byte 87 // push %edi
.byte 86 // push %esi
- .byte 131,236,124 // sub $0x7c,%esp
- .byte 232,0,0,0,0 // call 3a3e <_sk_load_tables_rgb_u16_be_sse2+0xe>
+ .byte 131,236,28 // sub $0x1c,%esp
+ .byte 232,0,0,0,0 // call 2cbc <_sk_load_tables_rgb_u16_be_sse2+0xe>
.byte 88 // pop %eax
.byte 137,69,240 // mov %eax,-0x10(%ebp)
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
.byte 139,69,12 // mov 0xc(%ebp),%eax
- .byte 131,125,24,0 // cmpl $0x0,0x18(%ebp)
- .byte 139,24 // mov (%eax),%ebx
- .byte 139,19 // mov (%ebx),%edx
- .byte 141,60,73 // lea (%ecx,%ecx,2),%edi
+ .byte 139,85,8 // mov 0x8(%ebp),%edx
+ .byte 139,74,8 // mov 0x8(%edx),%ecx
+ .byte 107,26,3 // imul $0x3,(%edx),%ebx
+ .byte 133,201 // test %ecx,%ecx
+ .byte 139,56 // mov (%eax),%edi
+ .byte 139,7 // mov (%edi),%eax
.byte 190,255,0,255,0 // mov $0xff00ff,%esi
- .byte 15,133,198,1,0,0 // jne 3c24 <_sk_load_tables_rgb_u16_be_sse2+0x1f4>
- .byte 243,15,111,12,122 // movdqu (%edx,%edi,2),%xmm1
- .byte 243,15,111,92,122,8 // movdqu 0x8(%edx,%edi,2),%xmm3
+ .byte 15,133,141,1,0,0 // jne 2e6a <_sk_load_tables_rgb_u16_be_sse2+0x1bc>
+ .byte 243,15,111,12,88 // movdqu (%eax,%ebx,2),%xmm1
+ .byte 243,15,111,92,88,8 // movdqu 0x8(%eax,%ebx,2),%xmm3
.byte 102,15,115,219,4 // psrldq $0x4,%xmm3
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
.byte 102,15,115,216,6 // psrldq $0x6,%xmm0
@@ -53488,132 +52485,118 @@ _sk_load_tables_rgb_u16_be_sse2:
.byte 102,15,97,194 // punpcklwd %xmm2,%xmm0
.byte 102,15,111,209 // movdqa %xmm1,%xmm2
.byte 102,15,97,208 // punpcklwd %xmm0,%xmm2
- .byte 102,15,112,218,78 // pshufd $0x4e,%xmm2,%xmm3
+ .byte 102,15,112,226,78 // pshufd $0x4e,%xmm2,%xmm4
.byte 102,15,105,200 // punpckhwd %xmm0,%xmm1
.byte 102,15,112,194,229 // pshufd $0xe5,%xmm2,%xmm0
- .byte 102,15,126,199 // movd %xmm0,%edi
- .byte 102,15,126,208 // movd %xmm2,%eax
- .byte 102,15,112,195,229 // pshufd $0xe5,%xmm3,%xmm0
- .byte 102,15,126,194 // movd %xmm0,%edx
+ .byte 102,15,126,192 // movd %xmm0,%eax
+ .byte 102,15,126,209 // movd %xmm2,%ecx
+ .byte 102,15,112,196,229 // pshufd $0xe5,%xmm4,%xmm0
+ .byte 102,15,126,195 // movd %xmm0,%ebx
+ .byte 33,241 // and %esi,%ecx
+ .byte 137,77,216 // mov %ecx,-0x28(%ebp)
.byte 33,240 // and %esi,%eax
- .byte 137,69,216 // mov %eax,-0x28(%ebp)
- .byte 33,247 // and %esi,%edi
- .byte 137,125,220 // mov %edi,-0x24(%ebp)
+ .byte 137,69,220 // mov %eax,-0x24(%ebp)
.byte 243,15,126,69,216 // movq -0x28(%ebp),%xmm0
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 102,15,97,194 // punpcklwd %xmm2,%xmm0
- .byte 102,15,239,246 // pxor %xmm6,%xmm6
- .byte 102,15,112,224,229 // pshufd $0xe5,%xmm0,%xmm4
- .byte 102,15,112,248,231 // pshufd $0xe7,%xmm0,%xmm7
- .byte 102,15,126,248 // movd %xmm7,%eax
- .byte 139,123,4 // mov 0x4(%ebx),%edi
- .byte 243,15,16,20,135 // movss (%edi,%eax,4),%xmm2
- .byte 102,15,126,224 // movd %xmm4,%eax
- .byte 243,15,16,60,135 // movss (%edi,%eax,4),%xmm7
+ .byte 102,15,239,255 // pxor %xmm7,%xmm7
+ .byte 102,15,112,216,229 // pshufd $0xe5,%xmm0,%xmm3
+ .byte 102,15,112,232,231 // pshufd $0xe7,%xmm0,%xmm5
+ .byte 102,15,126,232 // movd %xmm5,%eax
+ .byte 139,79,4 // mov 0x4(%edi),%ecx
+ .byte 243,15,16,52,129 // movss (%ecx,%eax,4),%xmm6
+ .byte 102,15,126,216 // movd %xmm3,%eax
+ .byte 243,15,16,20,129 // movss (%ecx,%eax,4),%xmm2
.byte 102,15,126,192 // movd %xmm0,%eax
- .byte 102,15,112,224,78 // pshufd $0x4e,%xmm0,%xmm4
- .byte 243,15,16,44,135 // movss (%edi,%eax,4),%xmm5
+ .byte 102,15,112,232,78 // pshufd $0x4e,%xmm0,%xmm5
+ .byte 243,15,16,28,129 // movss (%ecx,%eax,4),%xmm3
+ .byte 102,15,126,232 // movd %xmm5,%eax
+ .byte 243,15,16,44,129 // movss (%ecx,%eax,4),%xmm5
.byte 102,15,126,224 // movd %xmm4,%eax
- .byte 243,15,16,36,135 // movss (%edi,%eax,4),%xmm4
- .byte 102,15,126,216 // movd %xmm3,%eax
- .byte 102,15,112,217,229 // pshufd $0xe5,%xmm1,%xmm3
- .byte 139,123,8 // mov 0x8(%ebx),%edi
+ .byte 102,15,112,225,229 // pshufd $0xe5,%xmm1,%xmm4
+ .byte 139,79,8 // mov 0x8(%edi),%ecx
.byte 33,240 // and %esi,%eax
.byte 137,69,224 // mov %eax,-0x20(%ebp)
- .byte 102,15,126,216 // movd %xmm3,%eax
- .byte 33,242 // and %esi,%edx
- .byte 137,85,228 // mov %edx,-0x1c(%ebp)
- .byte 243,15,126,93,224 // movq -0x20(%ebp),%xmm3
- .byte 102,15,97,222 // punpcklwd %xmm6,%xmm3
- .byte 102,15,112,243,231 // pshufd $0xe7,%xmm3,%xmm6
- .byte 102,15,126,242 // movd %xmm6,%edx
- .byte 243,15,16,52,151 // movss (%edi,%edx,4),%xmm6
+ .byte 102,15,126,224 // movd %xmm4,%eax
+ .byte 33,243 // and %esi,%ebx
+ .byte 137,93,228 // mov %ebx,-0x1c(%ebp)
+ .byte 243,15,126,101,224 // movq -0x20(%ebp),%xmm4
+ .byte 102,15,97,231 // punpcklwd %xmm7,%xmm4
+ .byte 102,15,112,252,231 // pshufd $0xe7,%xmm4,%xmm7
+ .byte 102,15,126,251 // movd %xmm7,%ebx
+ .byte 243,15,16,60,153 // movss (%ecx,%ebx,4),%xmm7
+ .byte 102,15,126,203 // movd %xmm1,%ebx
+ .byte 102,15,112,204,229 // pshufd $0xe5,%xmm4,%xmm1
.byte 102,15,126,202 // movd %xmm1,%edx
- .byte 102,15,112,203,229 // pshufd $0xe5,%xmm3,%xmm1
- .byte 102,15,126,201 // movd %xmm1,%ecx
- .byte 243,15,16,4,143 // movss (%edi,%ecx,4),%xmm0
- .byte 15,20,250 // unpcklps %xmm2,%xmm7
- .byte 102,15,126,217 // movd %xmm3,%ecx
- .byte 243,15,16,12,143 // movss (%edi,%ecx,4),%xmm1
- .byte 102,15,112,211,78 // pshufd $0x4e,%xmm3,%xmm2
- .byte 102,15,126,209 // movd %xmm2,%ecx
- .byte 243,15,16,28,143 // movss (%edi,%ecx,4),%xmm3
- .byte 139,75,12 // mov 0xc(%ebx),%ecx
- .byte 33,242 // and %esi,%edx
- .byte 137,85,232 // mov %edx,-0x18(%ebp)
+ .byte 243,15,16,4,145 // movss (%ecx,%edx,4),%xmm0
+ .byte 15,20,214 // unpcklps %xmm6,%xmm2
+ .byte 102,15,126,226 // movd %xmm4,%edx
+ .byte 243,15,16,12,145 // movss (%ecx,%edx,4),%xmm1
+ .byte 102,15,112,228,78 // pshufd $0x4e,%xmm4,%xmm4
+ .byte 102,15,126,226 // movd %xmm4,%edx
+ .byte 243,15,16,36,145 // movss (%ecx,%edx,4),%xmm4
+ .byte 139,79,12 // mov 0xc(%edi),%ecx
+ .byte 33,243 // and %esi,%ebx
+ .byte 137,93,232 // mov %ebx,-0x18(%ebp)
.byte 33,240 // and %esi,%eax
- .byte 15,20,236 // unpcklps %xmm4,%xmm5
- .byte 15,20,239 // unpcklps %xmm7,%xmm5
- .byte 15,20,198 // unpcklps %xmm6,%xmm0
+ .byte 15,20,221 // unpcklps %xmm5,%xmm3
+ .byte 15,20,218 // unpcklps %xmm2,%xmm3
+ .byte 15,20,199 // unpcklps %xmm7,%xmm0
.byte 137,69,236 // mov %eax,-0x14(%ebp)
.byte 243,15,126,85,232 // movq -0x18(%ebp),%xmm2
- .byte 15,87,228 // xorps %xmm4,%xmm4
- .byte 102,15,97,212 // punpcklwd %xmm4,%xmm2
- .byte 102,15,112,226,229 // pshufd $0xe5,%xmm2,%xmm4
+ .byte 15,87,237 // xorps %xmm5,%xmm5
+ .byte 102,15,97,213 // punpcklwd %xmm5,%xmm2
+ .byte 102,15,112,234,229 // pshufd $0xe5,%xmm2,%xmm5
.byte 102,15,112,242,231 // pshufd $0xe7,%xmm2,%xmm6
.byte 102,15,126,240 // movd %xmm6,%eax
.byte 243,15,16,52,129 // movss (%ecx,%eax,4),%xmm6
- .byte 102,15,126,224 // movd %xmm4,%eax
- .byte 243,15,16,36,129 // movss (%ecx,%eax,4),%xmm4
+ .byte 102,15,126,232 // movd %xmm5,%eax
+ .byte 243,15,16,44,129 // movss (%ecx,%eax,4),%xmm5
.byte 102,15,126,208 // movd %xmm2,%eax
.byte 102,15,112,250,78 // pshufd $0x4e,%xmm2,%xmm7
.byte 243,15,16,20,129 // movss (%ecx,%eax,4),%xmm2
.byte 102,15,126,248 // movd %xmm7,%eax
.byte 243,15,16,60,129 // movss (%ecx,%eax,4),%xmm7
- .byte 15,20,203 // unpcklps %xmm3,%xmm1
+ .byte 15,20,204 // unpcklps %xmm4,%xmm1
.byte 15,20,200 // unpcklps %xmm0,%xmm1
- .byte 15,20,230 // unpcklps %xmm6,%xmm4
+ .byte 15,20,238 // unpcklps %xmm6,%xmm5
.byte 15,20,215 // unpcklps %xmm7,%xmm2
- .byte 15,20,212 // unpcklps %xmm4,%xmm2
+ .byte 15,20,213 // unpcklps %xmm5,%xmm2
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 137,193 // mov %eax,%ecx
.byte 141,65,8 // lea 0x8(%ecx),%eax
- .byte 15,40,69,88 // movaps 0x58(%ebp),%xmm0
- .byte 15,41,68,36,80 // movaps %xmm0,0x50(%esp)
- .byte 15,40,69,72 // movaps 0x48(%ebp),%xmm0
- .byte 15,41,68,36,64 // movaps %xmm0,0x40(%esp)
- .byte 15,40,69,56 // movaps 0x38(%ebp),%xmm0
- .byte 15,41,68,36,48 // movaps %xmm0,0x30(%esp)
- .byte 15,40,69,40 // movaps 0x28(%ebp),%xmm0
- .byte 15,41,68,36,32 // movaps %xmm0,0x20(%esp)
- .byte 139,85,24 // mov 0x18(%ebp),%edx
- .byte 137,84,36,16 // mov %edx,0x10(%esp)
- .byte 139,85,20 // mov 0x14(%ebp),%edx
- .byte 137,84,36,12 // mov %edx,0xc(%esp)
- .byte 139,85,16 // mov 0x10(%ebp),%edx
- .byte 137,84,36,8 // mov %edx,0x8(%esp)
- .byte 137,68,36,4 // mov %eax,0x4(%esp)
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 137,4,36 // mov %eax,(%esp)
- .byte 139,69,240 // mov -0x10(%ebp),%eax
- .byte 15,40,152,18,93,0,0 // movaps 0x5d12(%eax),%xmm3
- .byte 15,40,197 // movaps %xmm5,%xmm0
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 139,85,240 // mov -0x10(%ebp),%edx
+ .byte 15,40,162,164,71,0,0 // movaps 0x47a4(%edx),%xmm4
+ .byte 15,40,195 // movaps %xmm3,%xmm0
+ .byte 15,40,220 // movaps %xmm4,%xmm3
+ .byte 80 // push %eax
+ .byte 255,117,8 // pushl 0x8(%ebp)
.byte 255,81,4 // call *0x4(%ecx)
- .byte 131,196,124 // add $0x7c,%esp
+ .byte 131,196,44 // add $0x2c,%esp
.byte 94 // pop %esi
.byte 95 // pop %edi
.byte 91 // pop %ebx
.byte 93 // pop %ebp
.byte 195 // ret
- .byte 102,15,110,12,122 // movd (%edx,%edi,2),%xmm1
- .byte 102,15,196,76,122,4,2 // pinsrw $0x2,0x4(%edx,%edi,2),%xmm1
+ .byte 102,15,110,12,88 // movd (%eax,%ebx,2),%xmm1
+ .byte 102,15,196,76,88,4,2 // pinsrw $0x2,0x4(%eax,%ebx,2),%xmm1
.byte 102,15,239,210 // pxor %xmm2,%xmm2
- .byte 139,69,24 // mov 0x18(%ebp),%eax
- .byte 131,248,1 // cmp $0x1,%eax
- .byte 117,13 // jne 3c49 <_sk_load_tables_rgb_u16_be_sse2+0x219>
+ .byte 131,249,1 // cmp $0x1,%ecx
+ .byte 117,13 // jne 2e8c <_sk_load_tables_rgb_u16_be_sse2+0x1de>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 102,15,239,192 // pxor %xmm0,%xmm0
- .byte 233,55,254,255,255 // jmp 3a80 <_sk_load_tables_rgb_u16_be_sse2+0x50>
- .byte 102,15,110,68,122,6 // movd 0x6(%edx,%edi,2),%xmm0
- .byte 102,15,196,68,122,10,2 // pinsrw $0x2,0xa(%edx,%edi,2),%xmm0
+ .byte 233,115,254,255,255 // jmp 2cff <_sk_load_tables_rgb_u16_be_sse2+0x51>
+ .byte 102,15,110,68,88,6 // movd 0x6(%eax,%ebx,2),%xmm0
+ .byte 102,15,196,68,88,10,2 // pinsrw $0x2,0xa(%eax,%ebx,2),%xmm0
.byte 102,15,239,210 // pxor %xmm2,%xmm2
- .byte 131,248,3 // cmp $0x3,%eax
- .byte 114,18 // jb 3c71 <_sk_load_tables_rgb_u16_be_sse2+0x241>
- .byte 102,15,110,92,122,12 // movd 0xc(%edx,%edi,2),%xmm3
- .byte 102,15,196,92,122,16,2 // pinsrw $0x2,0x10(%edx,%edi,2),%xmm3
- .byte 233,15,254,255,255 // jmp 3a80 <_sk_load_tables_rgb_u16_be_sse2+0x50>
+ .byte 131,249,3 // cmp $0x3,%ecx
+ .byte 114,18 // jb 2eb4 <_sk_load_tables_rgb_u16_be_sse2+0x206>
+ .byte 102,15,110,92,88,12 // movd 0xc(%eax,%ebx,2),%xmm3
+ .byte 102,15,196,92,88,16,2 // pinsrw $0x2,0x10(%eax,%ebx,2),%xmm3
+ .byte 233,75,254,255,255 // jmp 2cff <_sk_load_tables_rgb_u16_be_sse2+0x51>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
- .byte 233,6,254,255,255 // jmp 3a80 <_sk_load_tables_rgb_u16_be_sse2+0x50>
+ .byte 233,66,254,255,255 // jmp 2cff <_sk_load_tables_rgb_u16_be_sse2+0x51>
HIDDEN _sk_byte_tables_sse2
.globl _sk_byte_tables_sse2
@@ -53624,35 +52607,35 @@ _sk_byte_tables_sse2:
.byte 83 // push %ebx
.byte 87 // push %edi
.byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 232,0,0,0,0 // call 3c88 <_sk_byte_tables_sse2+0xe>
+ .byte 131,236,12 // sub $0xc,%esp
+ .byte 232,0,0,0,0 // call 2ecb <_sk_byte_tables_sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,8 // mov (%eax),%ecx
- .byte 15,40,170,216,90,0,0 // movaps 0x5ad8(%edx),%xmm5
- .byte 15,89,197 // mulps %xmm5,%xmm0
+ .byte 15,40,162,165,69,0,0 // movaps 0x45a5(%edx),%xmm4
+ .byte 15,89,196 // mulps %xmm4,%xmm0
.byte 102,15,91,192 // cvtps2dq %xmm0,%xmm0
- .byte 102,15,112,224,78 // pshufd $0x4e,%xmm0,%xmm4
- .byte 102,15,126,230 // movd %xmm4,%esi
- .byte 102,15,112,224,231 // pshufd $0xe7,%xmm0,%xmm4
+ .byte 102,15,112,232,78 // pshufd $0x4e,%xmm0,%xmm5
+ .byte 102,15,126,238 // movd %xmm5,%esi
+ .byte 102,15,112,232,231 // pshufd $0xe7,%xmm0,%xmm5
.byte 139,57 // mov (%ecx),%edi
.byte 15,182,52,55 // movzbl (%edi,%esi,1),%esi
- .byte 102,15,126,227 // movd %xmm4,%ebx
+ .byte 102,15,126,235 // movd %xmm5,%ebx
.byte 15,182,28,31 // movzbl (%edi,%ebx,1),%ebx
.byte 193,227,8 // shl $0x8,%ebx
.byte 9,243 // or %esi,%ebx
- .byte 102,15,112,224,229 // pshufd $0xe5,%xmm0,%xmm4
+ .byte 102,15,112,232,229 // pshufd $0xe5,%xmm0,%xmm5
.byte 102,15,126,198 // movd %xmm0,%esi
.byte 15,182,52,55 // movzbl (%edi,%esi,1),%esi
- .byte 102,15,126,224 // movd %xmm4,%eax
+ .byte 102,15,126,232 // movd %xmm5,%eax
.byte 15,182,4,7 // movzbl (%edi,%eax,1),%eax
.byte 193,224,8 // shl $0x8,%eax
.byte 9,240 // or %esi,%eax
.byte 102,15,196,192,0 // pinsrw $0x0,%eax,%xmm0
.byte 139,65,4 // mov 0x4(%ecx),%eax
.byte 102,15,196,195,1 // pinsrw $0x1,%ebx,%xmm0
- .byte 15,40,162,232,90,0,0 // movaps 0x5ae8(%edx),%xmm4
- .byte 15,89,205 // mulps %xmm5,%xmm1
+ .byte 15,40,170,181,69,0,0 // movaps 0x45b5(%edx),%xmm5
+ .byte 15,89,204 // mulps %xmm4,%xmm1
.byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1
.byte 102,15,112,241,78 // pshufd $0x4e,%xmm1,%xmm6
.byte 102,15,126,242 // movd %xmm6,%edx
@@ -53672,7 +52655,7 @@ _sk_byte_tables_sse2:
.byte 102,15,196,200,0 // pinsrw $0x0,%eax,%xmm1
.byte 102,15,196,206,1 // pinsrw $0x1,%esi,%xmm1
.byte 139,65,8 // mov 0x8(%ecx),%eax
- .byte 15,89,213 // mulps %xmm5,%xmm2
+ .byte 15,89,212 // mulps %xmm4,%xmm2
.byte 102,15,91,210 // cvtps2dq %xmm2,%xmm2
.byte 102,15,112,242,78 // pshufd $0x4e,%xmm2,%xmm6
.byte 102,15,126,242 // movd %xmm6,%edx
@@ -53692,10 +52675,10 @@ _sk_byte_tables_sse2:
.byte 102,15,196,208,0 // pinsrw $0x0,%eax,%xmm2
.byte 102,15,196,214,1 // pinsrw $0x1,%esi,%xmm2
.byte 139,65,12 // mov 0xc(%ecx),%eax
- .byte 15,89,221 // mulps %xmm5,%xmm3
+ .byte 15,89,220 // mulps %xmm4,%xmm3
.byte 102,15,91,219 // cvtps2dq %xmm3,%xmm3
.byte 102,15,126,217 // movd %xmm3,%ecx
- .byte 102,15,112,235,229 // pshufd $0xe5,%xmm3,%xmm5
+ .byte 102,15,112,227,229 // pshufd $0xe5,%xmm3,%xmm4
.byte 102,15,112,243,78 // pshufd $0x4e,%xmm3,%xmm6
.byte 102,15,126,242 // movd %xmm6,%edx
.byte 102,15,112,219,231 // pshufd $0xe7,%xmm3,%xmm3
@@ -53704,51 +52687,37 @@ _sk_byte_tables_sse2:
.byte 15,182,52,48 // movzbl (%eax,%esi,1),%esi
.byte 193,230,8 // shl $0x8,%esi
.byte 9,214 // or %edx,%esi
- .byte 102,15,126,234 // movd %xmm5,%edx
+ .byte 102,15,126,226 // movd %xmm4,%edx
.byte 15,182,12,8 // movzbl (%eax,%ecx,1),%ecx
.byte 15,182,4,16 // movzbl (%eax,%edx,1),%eax
- .byte 139,85,8 // mov 0x8(%ebp),%edx
.byte 193,224,8 // shl $0x8,%eax
.byte 9,200 // or %ecx,%eax
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
.byte 102,15,196,216,0 // pinsrw $0x0,%eax,%xmm3
- .byte 139,69,20 // mov 0x14(%ebp),%eax
- .byte 102,15,196,222,1 // pinsrw $0x1,%esi,%xmm3
- .byte 139,117,24 // mov 0x18(%ebp),%esi
- .byte 15,40,109,40 // movaps 0x28(%ebp),%xmm5
- .byte 15,40,117,56 // movaps 0x38(%ebp),%xmm6
- .byte 102,15,239,255 // pxor %xmm7,%xmm7
- .byte 102,15,96,199 // punpcklbw %xmm7,%xmm0
- .byte 102,15,97,199 // punpcklwd %xmm7,%xmm0
- .byte 102,15,96,207 // punpcklbw %xmm7,%xmm1
- .byte 102,15,97,207 // punpcklwd %xmm7,%xmm1
- .byte 102,15,96,215 // punpcklbw %xmm7,%xmm2
- .byte 102,15,97,215 // punpcklwd %xmm7,%xmm2
- .byte 102,15,96,223 // punpcklbw %xmm7,%xmm3
- .byte 102,15,97,223 // punpcklwd %xmm7,%xmm3
- .byte 15,40,125,72 // movaps 0x48(%ebp),%xmm7
+ .byte 102,15,239,228 // pxor %xmm4,%xmm4
+ .byte 102,15,96,196 // punpcklbw %xmm4,%xmm0
+ .byte 102,15,97,196 // punpcklwd %xmm4,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,196 // mulps %xmm4,%xmm0
+ .byte 15,89,197 // mulps %xmm5,%xmm0
+ .byte 102,15,96,204 // punpcklbw %xmm4,%xmm1
+ .byte 102,15,97,204 // punpcklwd %xmm4,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,204 // mulps %xmm4,%xmm1
+ .byte 15,89,205 // mulps %xmm5,%xmm1
+ .byte 102,15,96,212 // punpcklbw %xmm4,%xmm2
+ .byte 102,15,97,212 // punpcklwd %xmm4,%xmm2
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,212 // mulps %xmm4,%xmm2
+ .byte 15,89,213 // mulps %xmm5,%xmm2
+ .byte 102,15,196,222,1 // pinsrw $0x1,%esi,%xmm3
+ .byte 102,15,96,220 // punpcklbw %xmm4,%xmm3
+ .byte 102,15,97,220 // punpcklwd %xmm4,%xmm3
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,220 // mulps %xmm4,%xmm3
- .byte 15,40,101,88 // movaps 0x58(%ebp),%xmm4
- .byte 139,93,12 // mov 0xc(%ebp),%ebx
- .byte 141,123,8 // lea 0x8(%ebx),%edi
- .byte 15,41,100,36,80 // movaps %xmm4,0x50(%esp)
- .byte 15,41,124,36,64 // movaps %xmm7,0x40(%esp)
- .byte 15,41,116,36,48 // movaps %xmm6,0x30(%esp)
- .byte 15,41,108,36,32 // movaps %xmm5,0x20(%esp)
- .byte 137,116,36,16 // mov %esi,0x10(%esp)
- .byte 137,68,36,12 // mov %eax,0xc(%esp)
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,124,36,4 // mov %edi,0x4(%esp)
- .byte 137,20,36 // mov %edx,(%esp)
- .byte 255,83,4 // call *0x4(%ebx)
- .byte 131,196,108 // add $0x6c,%esp
+ .byte 15,89,221 // mulps %xmm5,%xmm3
+ .byte 139,77,12 // mov 0xc(%ebp),%ecx
+ .byte 141,65,8 // lea 0x8(%ecx),%eax
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 80 // push %eax
+ .byte 255,117,8 // pushl 0x8(%ebp)
+ .byte 255,81,4 // call *0x4(%ecx)
+ .byte 131,196,28 // add $0x1c,%esp
.byte 94 // pop %esi
.byte 95 // pop %edi
.byte 91 // pop %ebx
@@ -53764,7 +52733,7 @@ _sk_byte_tables_rgb_sse2:
.byte 83 // push %ebx
.byte 87 // push %edi
.byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
+ .byte 131,236,12 // sub $0xc,%esp
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,8 // mov (%eax),%ecx
.byte 139,81,12 // mov 0xc(%ecx),%edx
@@ -53790,12 +52759,12 @@ _sk_byte_tables_rgb_sse2:
.byte 15,182,60,31 // movzbl (%edi,%ebx,1),%edi
.byte 193,231,8 // shl $0x8,%edi
.byte 9,215 // or %edx,%edi
- .byte 232,0,0,0,0 // call 3ec4 <_sk_byte_tables_rgb_sse2+0x65>
+ .byte 232,0,0,0,0 // call 30cb <_sk_byte_tables_rgb_sse2+0x65>
.byte 90 // pop %edx
.byte 102,15,196,199,0 // pinsrw $0x0,%edi,%xmm0
.byte 139,121,4 // mov 0x4(%ecx),%edi
.byte 102,15,196,198,1 // pinsrw $0x1,%esi,%xmm0
- .byte 15,40,170,188,88,0,0 // movaps 0x58bc(%edx),%xmm5
+ .byte 15,40,170,197,67,0,0 // movaps 0x43c5(%edx),%xmm5
.byte 15,89,204 // mulps %xmm4,%xmm1
.byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1
.byte 102,15,112,241,78 // pshufd $0x4e,%xmm1,%xmm6
@@ -53831,43 +52800,29 @@ _sk_byte_tables_rgb_sse2:
.byte 102,15,126,230 // movd %xmm4,%esi
.byte 15,182,20,17 // movzbl (%ecx,%edx,1),%edx
.byte 15,182,12,49 // movzbl (%ecx,%esi,1),%ecx
- .byte 139,117,8 // mov 0x8(%ebp),%esi
.byte 193,225,8 // shl $0x8,%ecx
.byte 9,209 // or %edx,%ecx
- .byte 139,85,16 // mov 0x10(%ebp),%edx
.byte 102,15,196,209,0 // pinsrw $0x0,%ecx,%xmm2
- .byte 139,77,20 // mov 0x14(%ebp),%ecx
- .byte 102,15,196,215,1 // pinsrw $0x1,%edi,%xmm2
- .byte 139,125,24 // mov 0x18(%ebp),%edi
- .byte 15,40,101,40 // movaps 0x28(%ebp),%xmm4
- .byte 15,40,117,56 // movaps 0x38(%ebp),%xmm6
- .byte 102,15,239,255 // pxor %xmm7,%xmm7
- .byte 102,15,96,199 // punpcklbw %xmm7,%xmm0
- .byte 102,15,97,199 // punpcklwd %xmm7,%xmm0
- .byte 102,15,96,207 // punpcklbw %xmm7,%xmm1
- .byte 102,15,97,207 // punpcklwd %xmm7,%xmm1
- .byte 102,15,96,215 // punpcklbw %xmm7,%xmm2
- .byte 102,15,97,215 // punpcklwd %xmm7,%xmm2
- .byte 15,40,125,72 // movaps 0x48(%ebp),%xmm7
+ .byte 102,15,239,228 // pxor %xmm4,%xmm4
+ .byte 102,15,96,196 // punpcklbw %xmm4,%xmm0
+ .byte 102,15,97,196 // punpcklwd %xmm4,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
.byte 15,89,197 // mulps %xmm5,%xmm0
+ .byte 102,15,96,204 // punpcklbw %xmm4,%xmm1
+ .byte 102,15,97,204 // punpcklwd %xmm4,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
.byte 15,89,205 // mulps %xmm5,%xmm1
+ .byte 102,15,196,215,1 // pinsrw $0x1,%edi,%xmm2
+ .byte 102,15,96,212 // punpcklbw %xmm4,%xmm2
+ .byte 102,15,97,212 // punpcklwd %xmm4,%xmm2
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
.byte 15,89,213 // mulps %xmm5,%xmm2
- .byte 15,40,109,88 // movaps 0x58(%ebp),%xmm5
- .byte 141,88,8 // lea 0x8(%eax),%ebx
- .byte 15,41,108,36,80 // movaps %xmm5,0x50(%esp)
- .byte 15,41,124,36,64 // movaps %xmm7,0x40(%esp)
- .byte 15,41,116,36,48 // movaps %xmm6,0x30(%esp)
- .byte 15,41,100,36,32 // movaps %xmm4,0x20(%esp)
- .byte 137,124,36,16 // mov %edi,0x10(%esp)
- .byte 137,76,36,12 // mov %ecx,0xc(%esp)
- .byte 137,84,36,8 // mov %edx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,52,36 // mov %esi,(%esp)
+ .byte 141,72,8 // lea 0x8(%eax),%ecx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 81 // push %ecx
+ .byte 255,117,8 // pushl 0x8(%ebp)
.byte 255,80,4 // call *0x4(%eax)
- .byte 131,196,108 // add $0x6c,%esp
+ .byte 131,196,28 // add $0x1c,%esp
.byte 94 // pop %esi
.byte 95 // pop %edi
.byte 91 // pop %ebx
@@ -53880,57 +52835,37 @@ FUNCTION(_sk_table_r_sse2)
_sk_table_r_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
- .byte 139,85,12 // mov 0xc(%ebp),%edx
- .byte 139,50 // mov (%edx),%esi
- .byte 139,62 // mov (%esi),%edi
- .byte 139,118,4 // mov 0x4(%esi),%esi
- .byte 78 // dec %esi
- .byte 102,15,110,230 // movd %esi,%xmm4
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 139,69,12 // mov 0xc(%ebp),%eax
+ .byte 139,8 // mov (%eax),%ecx
+ .byte 139,17 // mov (%ecx),%edx
+ .byte 139,73,4 // mov 0x4(%ecx),%ecx
+ .byte 73 // dec %ecx
+ .byte 102,15,110,225 // movd %ecx,%xmm4
.byte 102,15,112,228,0 // pshufd $0x0,%xmm4,%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
.byte 15,89,224 // mulps %xmm0,%xmm4
.byte 102,15,91,196 // cvtps2dq %xmm4,%xmm0
.byte 102,15,112,224,229 // pshufd $0xe5,%xmm0,%xmm4
.byte 102,15,112,232,231 // pshufd $0xe7,%xmm0,%xmm5
- .byte 102,15,126,238 // movd %xmm5,%esi
- .byte 243,15,16,44,183 // movss (%edi,%esi,4),%xmm5
- .byte 102,15,126,230 // movd %xmm4,%esi
- .byte 243,15,16,36,183 // movss (%edi,%esi,4),%xmm4
- .byte 102,15,126,198 // movd %xmm0,%esi
+ .byte 102,15,126,233 // movd %xmm5,%ecx
+ .byte 243,15,16,44,138 // movss (%edx,%ecx,4),%xmm5
+ .byte 102,15,126,225 // movd %xmm4,%ecx
+ .byte 243,15,16,36,138 // movss (%edx,%ecx,4),%xmm4
+ .byte 102,15,126,193 // movd %xmm0,%ecx
.byte 102,15,112,240,78 // pshufd $0x4e,%xmm0,%xmm6
- .byte 243,15,16,4,183 // movss (%edi,%esi,4),%xmm0
- .byte 102,15,126,246 // movd %xmm6,%esi
- .byte 243,15,16,52,183 // movss (%edi,%esi,4),%xmm6
- .byte 139,117,20 // mov 0x14(%ebp),%esi
- .byte 139,125,24 // mov 0x18(%ebp),%edi
- .byte 15,40,125,40 // movaps 0x28(%ebp),%xmm7
+ .byte 243,15,16,4,138 // movss (%edx,%ecx,4),%xmm0
+ .byte 102,15,126,241 // movd %xmm6,%ecx
+ .byte 243,15,16,52,138 // movss (%edx,%ecx,4),%xmm6
.byte 15,20,229 // unpcklps %xmm5,%xmm4
- .byte 15,40,109,56 // movaps 0x38(%ebp),%xmm5
.byte 15,20,198 // unpcklps %xmm6,%xmm0
- .byte 15,40,117,72 // movaps 0x48(%ebp),%xmm6
.byte 15,20,196 // unpcklps %xmm4,%xmm0
- .byte 15,40,101,88 // movaps 0x58(%ebp),%xmm4
- .byte 141,90,8 // lea 0x8(%edx),%ebx
- .byte 15,41,100,36,80 // movaps %xmm4,0x50(%esp)
- .byte 15,41,116,36,64 // movaps %xmm6,0x40(%esp)
- .byte 15,41,108,36,48 // movaps %xmm5,0x30(%esp)
- .byte 15,41,124,36,32 // movaps %xmm7,0x20(%esp)
- .byte 137,124,36,16 // mov %edi,0x10(%esp)
- .byte 137,116,36,12 // mov %esi,0xc(%esp)
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
- .byte 255,82,4 // call *0x4(%edx)
- .byte 131,196,108 // add $0x6c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 141,72,8 // lea 0x8(%eax),%ecx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 81 // push %ecx
+ .byte 255,117,8 // pushl 0x8(%ebp)
+ .byte 255,80,4 // call *0x4(%eax)
+ .byte 131,196,24 // add $0x18,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -53940,57 +52875,37 @@ FUNCTION(_sk_table_g_sse2)
_sk_table_g_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
- .byte 139,85,12 // mov 0xc(%ebp),%edx
- .byte 139,50 // mov (%edx),%esi
- .byte 139,62 // mov (%esi),%edi
- .byte 139,118,4 // mov 0x4(%esi),%esi
- .byte 78 // dec %esi
- .byte 102,15,110,230 // movd %esi,%xmm4
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 139,69,12 // mov 0xc(%ebp),%eax
+ .byte 139,8 // mov (%eax),%ecx
+ .byte 139,17 // mov (%ecx),%edx
+ .byte 139,73,4 // mov 0x4(%ecx),%ecx
+ .byte 73 // dec %ecx
+ .byte 102,15,110,225 // movd %ecx,%xmm4
.byte 102,15,112,228,0 // pshufd $0x0,%xmm4,%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
.byte 15,89,225 // mulps %xmm1,%xmm4
.byte 102,15,91,204 // cvtps2dq %xmm4,%xmm1
.byte 102,15,112,225,229 // pshufd $0xe5,%xmm1,%xmm4
.byte 102,15,112,233,231 // pshufd $0xe7,%xmm1,%xmm5
- .byte 102,15,126,238 // movd %xmm5,%esi
- .byte 243,15,16,44,183 // movss (%edi,%esi,4),%xmm5
- .byte 102,15,126,230 // movd %xmm4,%esi
- .byte 243,15,16,36,183 // movss (%edi,%esi,4),%xmm4
- .byte 102,15,126,206 // movd %xmm1,%esi
+ .byte 102,15,126,233 // movd %xmm5,%ecx
+ .byte 243,15,16,44,138 // movss (%edx,%ecx,4),%xmm5
+ .byte 102,15,126,225 // movd %xmm4,%ecx
+ .byte 243,15,16,36,138 // movss (%edx,%ecx,4),%xmm4
+ .byte 102,15,126,201 // movd %xmm1,%ecx
.byte 102,15,112,241,78 // pshufd $0x4e,%xmm1,%xmm6
- .byte 243,15,16,12,183 // movss (%edi,%esi,4),%xmm1
- .byte 102,15,126,246 // movd %xmm6,%esi
- .byte 243,15,16,52,183 // movss (%edi,%esi,4),%xmm6
- .byte 139,117,20 // mov 0x14(%ebp),%esi
- .byte 139,125,24 // mov 0x18(%ebp),%edi
- .byte 15,40,125,40 // movaps 0x28(%ebp),%xmm7
+ .byte 243,15,16,12,138 // movss (%edx,%ecx,4),%xmm1
+ .byte 102,15,126,241 // movd %xmm6,%ecx
+ .byte 243,15,16,52,138 // movss (%edx,%ecx,4),%xmm6
.byte 15,20,229 // unpcklps %xmm5,%xmm4
- .byte 15,40,109,56 // movaps 0x38(%ebp),%xmm5
.byte 15,20,206 // unpcklps %xmm6,%xmm1
- .byte 15,40,117,72 // movaps 0x48(%ebp),%xmm6
.byte 15,20,204 // unpcklps %xmm4,%xmm1
- .byte 15,40,101,88 // movaps 0x58(%ebp),%xmm4
- .byte 141,90,8 // lea 0x8(%edx),%ebx
- .byte 15,41,100,36,80 // movaps %xmm4,0x50(%esp)
- .byte 15,41,116,36,64 // movaps %xmm6,0x40(%esp)
- .byte 15,41,108,36,48 // movaps %xmm5,0x30(%esp)
- .byte 15,41,124,36,32 // movaps %xmm7,0x20(%esp)
- .byte 137,124,36,16 // mov %edi,0x10(%esp)
- .byte 137,116,36,12 // mov %esi,0xc(%esp)
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
- .byte 255,82,4 // call *0x4(%edx)
- .byte 131,196,108 // add $0x6c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 141,72,8 // lea 0x8(%eax),%ecx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 81 // push %ecx
+ .byte 255,117,8 // pushl 0x8(%ebp)
+ .byte 255,80,4 // call *0x4(%eax)
+ .byte 131,196,24 // add $0x18,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -54000,57 +52915,37 @@ FUNCTION(_sk_table_b_sse2)
_sk_table_b_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
- .byte 139,85,12 // mov 0xc(%ebp),%edx
- .byte 139,50 // mov (%edx),%esi
- .byte 139,62 // mov (%esi),%edi
- .byte 139,118,4 // mov 0x4(%esi),%esi
- .byte 78 // dec %esi
- .byte 102,15,110,230 // movd %esi,%xmm4
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 139,69,12 // mov 0xc(%ebp),%eax
+ .byte 139,8 // mov (%eax),%ecx
+ .byte 139,17 // mov (%ecx),%edx
+ .byte 139,73,4 // mov 0x4(%ecx),%ecx
+ .byte 73 // dec %ecx
+ .byte 102,15,110,225 // movd %ecx,%xmm4
.byte 102,15,112,228,0 // pshufd $0x0,%xmm4,%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
.byte 15,89,226 // mulps %xmm2,%xmm4
.byte 102,15,91,212 // cvtps2dq %xmm4,%xmm2
.byte 102,15,112,226,229 // pshufd $0xe5,%xmm2,%xmm4
.byte 102,15,112,234,231 // pshufd $0xe7,%xmm2,%xmm5
- .byte 102,15,126,238 // movd %xmm5,%esi
- .byte 243,15,16,44,183 // movss (%edi,%esi,4),%xmm5
- .byte 102,15,126,230 // movd %xmm4,%esi
- .byte 243,15,16,36,183 // movss (%edi,%esi,4),%xmm4
- .byte 102,15,126,214 // movd %xmm2,%esi
+ .byte 102,15,126,233 // movd %xmm5,%ecx
+ .byte 243,15,16,44,138 // movss (%edx,%ecx,4),%xmm5
+ .byte 102,15,126,225 // movd %xmm4,%ecx
+ .byte 243,15,16,36,138 // movss (%edx,%ecx,4),%xmm4
+ .byte 102,15,126,209 // movd %xmm2,%ecx
.byte 102,15,112,242,78 // pshufd $0x4e,%xmm2,%xmm6
- .byte 243,15,16,20,183 // movss (%edi,%esi,4),%xmm2
- .byte 102,15,126,246 // movd %xmm6,%esi
- .byte 243,15,16,52,183 // movss (%edi,%esi,4),%xmm6
- .byte 139,117,20 // mov 0x14(%ebp),%esi
- .byte 139,125,24 // mov 0x18(%ebp),%edi
- .byte 15,40,125,40 // movaps 0x28(%ebp),%xmm7
+ .byte 243,15,16,20,138 // movss (%edx,%ecx,4),%xmm2
+ .byte 102,15,126,241 // movd %xmm6,%ecx
+ .byte 243,15,16,52,138 // movss (%edx,%ecx,4),%xmm6
.byte 15,20,229 // unpcklps %xmm5,%xmm4
- .byte 15,40,109,56 // movaps 0x38(%ebp),%xmm5
.byte 15,20,214 // unpcklps %xmm6,%xmm2
- .byte 15,40,117,72 // movaps 0x48(%ebp),%xmm6
.byte 15,20,212 // unpcklps %xmm4,%xmm2
- .byte 15,40,101,88 // movaps 0x58(%ebp),%xmm4
- .byte 141,90,8 // lea 0x8(%edx),%ebx
- .byte 15,41,100,36,80 // movaps %xmm4,0x50(%esp)
- .byte 15,41,116,36,64 // movaps %xmm6,0x40(%esp)
- .byte 15,41,108,36,48 // movaps %xmm5,0x30(%esp)
- .byte 15,41,124,36,32 // movaps %xmm7,0x20(%esp)
- .byte 137,124,36,16 // mov %edi,0x10(%esp)
- .byte 137,116,36,12 // mov %esi,0xc(%esp)
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
- .byte 255,82,4 // call *0x4(%edx)
- .byte 131,196,108 // add $0x6c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 141,72,8 // lea 0x8(%eax),%ecx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 81 // push %ecx
+ .byte 255,117,8 // pushl 0x8(%ebp)
+ .byte 255,80,4 // call *0x4(%eax)
+ .byte 131,196,24 // add $0x18,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -54060,57 +52955,37 @@ FUNCTION(_sk_table_a_sse2)
_sk_table_a_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
- .byte 139,85,12 // mov 0xc(%ebp),%edx
- .byte 139,50 // mov (%edx),%esi
- .byte 139,62 // mov (%esi),%edi
- .byte 139,118,4 // mov 0x4(%esi),%esi
- .byte 78 // dec %esi
- .byte 102,15,110,230 // movd %esi,%xmm4
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 139,69,12 // mov 0xc(%ebp),%eax
+ .byte 139,8 // mov (%eax),%ecx
+ .byte 139,17 // mov (%ecx),%edx
+ .byte 139,73,4 // mov 0x4(%ecx),%ecx
+ .byte 73 // dec %ecx
+ .byte 102,15,110,225 // movd %ecx,%xmm4
.byte 102,15,112,228,0 // pshufd $0x0,%xmm4,%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
.byte 15,89,227 // mulps %xmm3,%xmm4
.byte 102,15,91,220 // cvtps2dq %xmm4,%xmm3
.byte 102,15,112,227,229 // pshufd $0xe5,%xmm3,%xmm4
.byte 102,15,112,235,231 // pshufd $0xe7,%xmm3,%xmm5
- .byte 102,15,126,238 // movd %xmm5,%esi
- .byte 243,15,16,44,183 // movss (%edi,%esi,4),%xmm5
- .byte 102,15,126,230 // movd %xmm4,%esi
- .byte 243,15,16,36,183 // movss (%edi,%esi,4),%xmm4
- .byte 102,15,126,222 // movd %xmm3,%esi
+ .byte 102,15,126,233 // movd %xmm5,%ecx
+ .byte 243,15,16,44,138 // movss (%edx,%ecx,4),%xmm5
+ .byte 102,15,126,225 // movd %xmm4,%ecx
+ .byte 243,15,16,36,138 // movss (%edx,%ecx,4),%xmm4
+ .byte 102,15,126,217 // movd %xmm3,%ecx
.byte 102,15,112,243,78 // pshufd $0x4e,%xmm3,%xmm6
- .byte 243,15,16,28,183 // movss (%edi,%esi,4),%xmm3
- .byte 102,15,126,246 // movd %xmm6,%esi
- .byte 243,15,16,52,183 // movss (%edi,%esi,4),%xmm6
- .byte 139,117,20 // mov 0x14(%ebp),%esi
- .byte 139,125,24 // mov 0x18(%ebp),%edi
- .byte 15,40,125,40 // movaps 0x28(%ebp),%xmm7
+ .byte 243,15,16,28,138 // movss (%edx,%ecx,4),%xmm3
+ .byte 102,15,126,241 // movd %xmm6,%ecx
+ .byte 243,15,16,52,138 // movss (%edx,%ecx,4),%xmm6
.byte 15,20,229 // unpcklps %xmm5,%xmm4
- .byte 15,40,109,56 // movaps 0x38(%ebp),%xmm5
.byte 15,20,222 // unpcklps %xmm6,%xmm3
- .byte 15,40,117,72 // movaps 0x48(%ebp),%xmm6
.byte 15,20,220 // unpcklps %xmm4,%xmm3
- .byte 15,40,101,88 // movaps 0x58(%ebp),%xmm4
- .byte 141,90,8 // lea 0x8(%edx),%ebx
- .byte 15,41,100,36,80 // movaps %xmm4,0x50(%esp)
- .byte 15,41,116,36,64 // movaps %xmm6,0x40(%esp)
- .byte 15,41,108,36,48 // movaps %xmm5,0x30(%esp)
- .byte 15,41,124,36,32 // movaps %xmm7,0x20(%esp)
- .byte 137,124,36,16 // mov %edi,0x10(%esp)
- .byte 137,116,36,12 // mov %esi,0xc(%esp)
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
- .byte 255,82,4 // call *0x4(%edx)
- .byte 131,196,108 // add $0x6c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 141,72,8 // lea 0x8(%eax),%ecx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 81 // push %ecx
+ .byte 255,117,8 // pushl 0x8(%ebp)
+ .byte 255,80,4 // call *0x4(%eax)
+ .byte 131,196,24 // add $0x18,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -54120,96 +52995,84 @@ FUNCTION(_sk_parametric_r_sse2)
_sk_parametric_r_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 232,0,0,0,0 // call 42cd <_sk_parametric_r_sse2+0xe>
- .byte 94 // pop %esi
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
- .byte 139,85,12 // mov 0xc(%ebp),%edx
- .byte 139,58 // mov (%edx),%edi
- .byte 243,15,16,47 // movss (%edi),%xmm5
- .byte 243,15,16,119,4 // movss 0x4(%edi),%xmm6
- .byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6
- .byte 243,15,16,103,8 // movss 0x8(%edi),%xmm4
+ .byte 131,236,24 // sub $0x18,%esp
+ .byte 15,41,93,232 // movaps %xmm3,-0x18(%ebp)
+ .byte 15,40,218 // movaps %xmm2,%xmm3
+ .byte 15,40,209 // movaps %xmm1,%xmm2
+ .byte 15,40,200 // movaps %xmm0,%xmm1
+ .byte 232,0,0,0,0 // call 339a <_sk_parametric_r_sse2+0x18>
+ .byte 90 // pop %edx
+ .byte 139,69,12 // mov 0xc(%ebp),%eax
+ .byte 139,8 // mov (%eax),%ecx
+ .byte 243,15,16,105,16 // movss 0x10(%ecx),%xmm5
+ .byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
+ .byte 243,15,16,97,12 // movss 0xc(%ecx),%xmm4
.byte 15,198,228,0 // shufps $0x0,%xmm4,%xmm4
- .byte 15,89,240 // mulps %xmm0,%xmm6
- .byte 15,88,244 // addps %xmm4,%xmm6
+ .byte 15,89,225 // mulps %xmm1,%xmm4
+ .byte 243,15,16,113,4 // movss 0x4(%ecx),%xmm6
+ .byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6
+ .byte 15,89,241 // mulps %xmm1,%xmm6
+ .byte 15,194,205,2 // cmpleps %xmm5,%xmm1
+ .byte 243,15,16,105,24 // movss 0x18(%ecx),%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
- .byte 15,91,230 // cvtdq2ps %xmm6,%xmm4
- .byte 15,89,166,195,84,0,0 // mulps 0x54c3(%esi),%xmm4
- .byte 15,84,182,211,84,0,0 // andps 0x54d3(%esi),%xmm6
- .byte 15,86,182,227,84,0,0 // orps 0x54e3(%esi),%xmm6
- .byte 15,88,166,243,84,0,0 // addps 0x54f3(%esi),%xmm4
- .byte 15,40,190,3,85,0,0 // movaps 0x5503(%esi),%xmm7
+ .byte 15,88,229 // addps %xmm5,%xmm4
+ .byte 243,15,16,105,8 // movss 0x8(%ecx),%xmm5
+ .byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
+ .byte 15,88,245 // addps %xmm5,%xmm6
+ .byte 15,91,238 // cvtdq2ps %xmm6,%xmm5
+ .byte 15,89,170,6,65,0,0 // mulps 0x4106(%edx),%xmm5
+ .byte 15,84,178,22,65,0,0 // andps 0x4116(%edx),%xmm6
+ .byte 15,86,178,38,65,0,0 // orps 0x4126(%edx),%xmm6
+ .byte 15,88,170,54,65,0,0 // addps 0x4136(%edx),%xmm5
+ .byte 15,40,186,70,65,0,0 // movaps 0x4146(%edx),%xmm7
.byte 15,89,254 // mulps %xmm6,%xmm7
- .byte 15,92,231 // subps %xmm7,%xmm4
- .byte 15,88,182,19,85,0,0 // addps 0x5513(%esi),%xmm6
- .byte 15,40,190,35,85,0,0 // movaps 0x5523(%esi),%xmm7
- .byte 15,94,254 // divps %xmm6,%xmm7
- .byte 15,92,231 // subps %xmm7,%xmm4
- .byte 15,89,229 // mulps %xmm5,%xmm4
- .byte 243,15,91,236 // cvttps2dq %xmm4,%xmm5
- .byte 15,91,245 // cvtdq2ps %xmm5,%xmm6
- .byte 15,40,252 // movaps %xmm4,%xmm7
- .byte 15,194,254,1 // cmpltps %xmm6,%xmm7
- .byte 15,40,174,51,85,0,0 // movaps 0x5533(%esi),%xmm5
- .byte 15,84,253 // andps %xmm5,%xmm7
- .byte 15,92,247 // subps %xmm7,%xmm6
- .byte 15,40,252 // movaps %xmm4,%xmm7
- .byte 15,92,254 // subps %xmm6,%xmm7
- .byte 15,88,166,67,85,0,0 // addps 0x5543(%esi),%xmm4
- .byte 15,40,182,83,85,0,0 // movaps 0x5553(%esi),%xmm6
- .byte 15,89,247 // mulps %xmm7,%xmm6
- .byte 15,92,230 // subps %xmm6,%xmm4
- .byte 15,40,182,99,85,0,0 // movaps 0x5563(%esi),%xmm6
- .byte 15,92,247 // subps %xmm7,%xmm6
- .byte 15,40,190,115,85,0,0 // movaps 0x5573(%esi),%xmm7
+ .byte 15,92,239 // subps %xmm7,%xmm5
+ .byte 15,88,178,86,65,0,0 // addps 0x4156(%edx),%xmm6
+ .byte 15,40,186,102,65,0,0 // movaps 0x4166(%edx),%xmm7
.byte 15,94,254 // divps %xmm6,%xmm7
- .byte 15,88,252 // addps %xmm4,%xmm7
- .byte 15,89,190,131,85,0,0 // mulps 0x5583(%esi),%xmm7
- .byte 139,117,20 // mov 0x14(%ebp),%esi
- .byte 243,15,16,103,16 // movss 0x10(%edi),%xmm4
- .byte 15,198,228,0 // shufps $0x0,%xmm4,%xmm4
- .byte 243,15,16,119,12 // movss 0xc(%edi),%xmm6
+ .byte 243,15,16,49 // movss (%ecx),%xmm6
.byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6
- .byte 15,89,240 // mulps %xmm0,%xmm6
- .byte 15,194,196,2 // cmpleps %xmm4,%xmm0
- .byte 243,15,16,103,24 // movss 0x18(%edi),%xmm4
- .byte 15,198,228,0 // shufps $0x0,%xmm4,%xmm4
- .byte 15,88,244 // addps %xmm4,%xmm6
- .byte 243,15,16,103,20 // movss 0x14(%edi),%xmm4
- .byte 139,125,24 // mov 0x18(%ebp),%edi
- .byte 102,15,91,255 // cvtps2dq %xmm7,%xmm7
- .byte 15,198,228,0 // shufps $0x0,%xmm4,%xmm4
- .byte 15,88,231 // addps %xmm7,%xmm4
- .byte 15,40,125,40 // movaps 0x28(%ebp),%xmm7
- .byte 15,84,240 // andps %xmm0,%xmm6
- .byte 15,85,196 // andnps %xmm4,%xmm0
- .byte 15,40,101,56 // movaps 0x38(%ebp),%xmm4
- .byte 15,86,198 // orps %xmm6,%xmm0
- .byte 15,87,246 // xorps %xmm6,%xmm6
- .byte 15,95,198 // maxps %xmm6,%xmm0
- .byte 15,40,117,72 // movaps 0x48(%ebp),%xmm6
- .byte 15,93,197 // minps %xmm5,%xmm0
- .byte 15,40,109,88 // movaps 0x58(%ebp),%xmm5
- .byte 141,90,8 // lea 0x8(%edx),%ebx
- .byte 15,41,108,36,80 // movaps %xmm5,0x50(%esp)
- .byte 15,41,116,36,64 // movaps %xmm6,0x40(%esp)
- .byte 15,41,100,36,48 // movaps %xmm4,0x30(%esp)
- .byte 15,41,124,36,32 // movaps %xmm7,0x20(%esp)
- .byte 137,124,36,16 // mov %edi,0x10(%esp)
- .byte 137,116,36,12 // mov %esi,0xc(%esp)
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
- .byte 255,82,4 // call *0x4(%edx)
- .byte 131,196,108 // add $0x6c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 15,92,239 // subps %xmm7,%xmm5
+ .byte 15,89,238 // mulps %xmm6,%xmm5
+ .byte 243,15,91,245 // cvttps2dq %xmm5,%xmm6
+ .byte 15,91,254 // cvtdq2ps %xmm6,%xmm7
+ .byte 15,40,197 // movaps %xmm5,%xmm0
+ .byte 15,194,199,1 // cmpltps %xmm7,%xmm0
+ .byte 15,40,178,118,65,0,0 // movaps 0x4176(%edx),%xmm6
+ .byte 15,84,198 // andps %xmm6,%xmm0
+ .byte 15,92,248 // subps %xmm0,%xmm7
+ .byte 15,40,197 // movaps %xmm5,%xmm0
+ .byte 15,92,199 // subps %xmm7,%xmm0
+ .byte 15,88,170,134,65,0,0 // addps 0x4186(%edx),%xmm5
+ .byte 15,40,186,150,65,0,0 // movaps 0x4196(%edx),%xmm7
+ .byte 15,89,248 // mulps %xmm0,%xmm7
+ .byte 15,92,239 // subps %xmm7,%xmm5
+ .byte 15,40,186,166,65,0,0 // movaps 0x41a6(%edx),%xmm7
+ .byte 15,92,248 // subps %xmm0,%xmm7
+ .byte 15,40,130,182,65,0,0 // movaps 0x41b6(%edx),%xmm0
+ .byte 15,94,199 // divps %xmm7,%xmm0
+ .byte 15,88,197 // addps %xmm5,%xmm0
+ .byte 15,89,130,198,65,0,0 // mulps 0x41c6(%edx),%xmm0
+ .byte 102,15,91,192 // cvtps2dq %xmm0,%xmm0
+ .byte 243,15,16,105,20 // movss 0x14(%ecx),%xmm5
+ .byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
+ .byte 15,88,232 // addps %xmm0,%xmm5
+ .byte 15,84,225 // andps %xmm1,%xmm4
+ .byte 15,85,205 // andnps %xmm5,%xmm1
+ .byte 15,86,204 // orps %xmm4,%xmm1
+ .byte 15,87,192 // xorps %xmm0,%xmm0
+ .byte 15,95,200 // maxps %xmm0,%xmm1
+ .byte 15,93,206 // minps %xmm6,%xmm1
+ .byte 141,72,8 // lea 0x8(%eax),%ecx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 15,40,193 // movaps %xmm1,%xmm0
+ .byte 15,40,202 // movaps %xmm2,%xmm1
+ .byte 15,40,211 // movaps %xmm3,%xmm2
+ .byte 15,40,93,232 // movaps -0x18(%ebp),%xmm3
+ .byte 81 // push %ecx
+ .byte 255,117,8 // pushl 0x8(%ebp)
+ .byte 255,80,4 // call *0x4(%eax)
+ .byte 131,196,40 // add $0x28,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -54219,96 +53082,82 @@ FUNCTION(_sk_parametric_g_sse2)
_sk_parametric_g_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 232,0,0,0,0 // call 442f <_sk_parametric_g_sse2+0xe>
- .byte 94 // pop %esi
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
- .byte 139,85,12 // mov 0xc(%ebp),%edx
- .byte 139,58 // mov (%edx),%edi
- .byte 243,15,16,47 // movss (%edi),%xmm5
- .byte 243,15,16,119,4 // movss 0x4(%edi),%xmm6
- .byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6
- .byte 243,15,16,103,8 // movss 0x8(%edi),%xmm4
+ .byte 131,236,24 // sub $0x18,%esp
+ .byte 15,41,93,232 // movaps %xmm3,-0x18(%ebp)
+ .byte 15,40,218 // movaps %xmm2,%xmm3
+ .byte 15,40,208 // movaps %xmm0,%xmm2
+ .byte 232,0,0,0,0 // call 34d1 <_sk_parametric_g_sse2+0x15>
+ .byte 90 // pop %edx
+ .byte 139,69,12 // mov 0xc(%ebp),%eax
+ .byte 139,8 // mov (%eax),%ecx
+ .byte 243,15,16,105,16 // movss 0x10(%ecx),%xmm5
+ .byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
+ .byte 243,15,16,97,12 // movss 0xc(%ecx),%xmm4
.byte 15,198,228,0 // shufps $0x0,%xmm4,%xmm4
+ .byte 15,89,225 // mulps %xmm1,%xmm4
+ .byte 243,15,16,113,4 // movss 0x4(%ecx),%xmm6
+ .byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6
.byte 15,89,241 // mulps %xmm1,%xmm6
- .byte 15,88,244 // addps %xmm4,%xmm6
+ .byte 15,194,205,2 // cmpleps %xmm5,%xmm1
+ .byte 243,15,16,105,24 // movss 0x18(%ecx),%xmm5
+ .byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
+ .byte 15,88,229 // addps %xmm5,%xmm4
+ .byte 243,15,16,105,8 // movss 0x8(%ecx),%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
- .byte 15,91,230 // cvtdq2ps %xmm6,%xmm4
- .byte 15,89,166,49,84,0,0 // mulps 0x5431(%esi),%xmm4
- .byte 15,84,182,65,84,0,0 // andps 0x5441(%esi),%xmm6
- .byte 15,86,182,81,84,0,0 // orps 0x5451(%esi),%xmm6
- .byte 15,88,166,97,84,0,0 // addps 0x5461(%esi),%xmm4
- .byte 15,40,190,113,84,0,0 // movaps 0x5471(%esi),%xmm7
+ .byte 15,88,245 // addps %xmm5,%xmm6
+ .byte 15,91,238 // cvtdq2ps %xmm6,%xmm5
+ .byte 15,89,170,159,64,0,0 // mulps 0x409f(%edx),%xmm5
+ .byte 15,84,178,175,64,0,0 // andps 0x40af(%edx),%xmm6
+ .byte 15,86,178,191,64,0,0 // orps 0x40bf(%edx),%xmm6
+ .byte 15,88,170,207,64,0,0 // addps 0x40cf(%edx),%xmm5
+ .byte 15,40,186,223,64,0,0 // movaps 0x40df(%edx),%xmm7
.byte 15,89,254 // mulps %xmm6,%xmm7
- .byte 15,92,231 // subps %xmm7,%xmm4
- .byte 15,88,182,129,84,0,0 // addps 0x5481(%esi),%xmm6
- .byte 15,40,190,145,84,0,0 // movaps 0x5491(%esi),%xmm7
- .byte 15,94,254 // divps %xmm6,%xmm7
- .byte 15,92,231 // subps %xmm7,%xmm4
- .byte 15,89,229 // mulps %xmm5,%xmm4
- .byte 243,15,91,236 // cvttps2dq %xmm4,%xmm5
- .byte 15,91,245 // cvtdq2ps %xmm5,%xmm6
- .byte 15,40,252 // movaps %xmm4,%xmm7
- .byte 15,194,254,1 // cmpltps %xmm6,%xmm7
- .byte 15,40,174,161,84,0,0 // movaps 0x54a1(%esi),%xmm5
- .byte 15,84,253 // andps %xmm5,%xmm7
- .byte 15,92,247 // subps %xmm7,%xmm6
- .byte 15,40,252 // movaps %xmm4,%xmm7
- .byte 15,92,254 // subps %xmm6,%xmm7
- .byte 15,88,166,177,84,0,0 // addps 0x54b1(%esi),%xmm4
- .byte 15,40,182,193,84,0,0 // movaps 0x54c1(%esi),%xmm6
- .byte 15,89,247 // mulps %xmm7,%xmm6
- .byte 15,92,230 // subps %xmm6,%xmm4
- .byte 15,40,182,209,84,0,0 // movaps 0x54d1(%esi),%xmm6
- .byte 15,92,247 // subps %xmm7,%xmm6
- .byte 15,40,190,225,84,0,0 // movaps 0x54e1(%esi),%xmm7
+ .byte 15,92,239 // subps %xmm7,%xmm5
+ .byte 15,88,178,239,64,0,0 // addps 0x40ef(%edx),%xmm6
+ .byte 15,40,186,255,64,0,0 // movaps 0x40ff(%edx),%xmm7
.byte 15,94,254 // divps %xmm6,%xmm7
- .byte 15,88,252 // addps %xmm4,%xmm7
- .byte 15,89,190,241,84,0,0 // mulps 0x54f1(%esi),%xmm7
- .byte 139,117,20 // mov 0x14(%ebp),%esi
- .byte 243,15,16,103,16 // movss 0x10(%edi),%xmm4
- .byte 15,198,228,0 // shufps $0x0,%xmm4,%xmm4
- .byte 243,15,16,119,12 // movss 0xc(%edi),%xmm6
+ .byte 243,15,16,49 // movss (%ecx),%xmm6
.byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6
- .byte 15,89,241 // mulps %xmm1,%xmm6
- .byte 15,194,204,2 // cmpleps %xmm4,%xmm1
- .byte 243,15,16,103,24 // movss 0x18(%edi),%xmm4
- .byte 15,198,228,0 // shufps $0x0,%xmm4,%xmm4
- .byte 15,88,244 // addps %xmm4,%xmm6
- .byte 243,15,16,103,20 // movss 0x14(%edi),%xmm4
- .byte 139,125,24 // mov 0x18(%ebp),%edi
- .byte 102,15,91,255 // cvtps2dq %xmm7,%xmm7
- .byte 15,198,228,0 // shufps $0x0,%xmm4,%xmm4
- .byte 15,88,231 // addps %xmm7,%xmm4
- .byte 15,40,125,40 // movaps 0x28(%ebp),%xmm7
- .byte 15,84,241 // andps %xmm1,%xmm6
- .byte 15,85,204 // andnps %xmm4,%xmm1
- .byte 15,40,101,56 // movaps 0x38(%ebp),%xmm4
- .byte 15,86,206 // orps %xmm6,%xmm1
- .byte 15,87,246 // xorps %xmm6,%xmm6
- .byte 15,95,206 // maxps %xmm6,%xmm1
- .byte 15,40,117,72 // movaps 0x48(%ebp),%xmm6
- .byte 15,93,205 // minps %xmm5,%xmm1
- .byte 15,40,109,88 // movaps 0x58(%ebp),%xmm5
- .byte 141,90,8 // lea 0x8(%edx),%ebx
- .byte 15,41,108,36,80 // movaps %xmm5,0x50(%esp)
- .byte 15,41,116,36,64 // movaps %xmm6,0x40(%esp)
- .byte 15,41,100,36,48 // movaps %xmm4,0x30(%esp)
- .byte 15,41,124,36,32 // movaps %xmm7,0x20(%esp)
- .byte 137,124,36,16 // mov %edi,0x10(%esp)
- .byte 137,116,36,12 // mov %esi,0xc(%esp)
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
- .byte 255,82,4 // call *0x4(%edx)
- .byte 131,196,108 // add $0x6c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 15,92,239 // subps %xmm7,%xmm5
+ .byte 15,89,238 // mulps %xmm6,%xmm5
+ .byte 243,15,91,245 // cvttps2dq %xmm5,%xmm6
+ .byte 15,91,254 // cvtdq2ps %xmm6,%xmm7
+ .byte 15,40,197 // movaps %xmm5,%xmm0
+ .byte 15,194,199,1 // cmpltps %xmm7,%xmm0
+ .byte 15,40,178,15,65,0,0 // movaps 0x410f(%edx),%xmm6
+ .byte 15,84,198 // andps %xmm6,%xmm0
+ .byte 15,92,248 // subps %xmm0,%xmm7
+ .byte 15,40,197 // movaps %xmm5,%xmm0
+ .byte 15,92,199 // subps %xmm7,%xmm0
+ .byte 15,88,170,31,65,0,0 // addps 0x411f(%edx),%xmm5
+ .byte 15,40,186,47,65,0,0 // movaps 0x412f(%edx),%xmm7
+ .byte 15,89,248 // mulps %xmm0,%xmm7
+ .byte 15,92,239 // subps %xmm7,%xmm5
+ .byte 15,40,186,63,65,0,0 // movaps 0x413f(%edx),%xmm7
+ .byte 15,92,248 // subps %xmm0,%xmm7
+ .byte 15,40,130,79,65,0,0 // movaps 0x414f(%edx),%xmm0
+ .byte 15,94,199 // divps %xmm7,%xmm0
+ .byte 15,88,197 // addps %xmm5,%xmm0
+ .byte 15,89,130,95,65,0,0 // mulps 0x415f(%edx),%xmm0
+ .byte 102,15,91,192 // cvtps2dq %xmm0,%xmm0
+ .byte 243,15,16,105,20 // movss 0x14(%ecx),%xmm5
+ .byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
+ .byte 15,88,232 // addps %xmm0,%xmm5
+ .byte 15,84,225 // andps %xmm1,%xmm4
+ .byte 15,85,205 // andnps %xmm5,%xmm1
+ .byte 15,86,204 // orps %xmm4,%xmm1
+ .byte 15,87,192 // xorps %xmm0,%xmm0
+ .byte 15,95,200 // maxps %xmm0,%xmm1
+ .byte 15,93,206 // minps %xmm6,%xmm1
+ .byte 141,72,8 // lea 0x8(%eax),%ecx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 15,40,194 // movaps %xmm2,%xmm0
+ .byte 15,40,211 // movaps %xmm3,%xmm2
+ .byte 15,40,93,232 // movaps -0x18(%ebp),%xmm3
+ .byte 81 // push %ecx
+ .byte 255,117,8 // pushl 0x8(%ebp)
+ .byte 255,80,4 // call *0x4(%eax)
+ .byte 131,196,40 // add $0x28,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -54318,96 +53167,82 @@ FUNCTION(_sk_parametric_b_sse2)
_sk_parametric_b_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 232,0,0,0,0 // call 4591 <_sk_parametric_b_sse2+0xe>
- .byte 94 // pop %esi
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
- .byte 139,85,12 // mov 0xc(%ebp),%edx
- .byte 139,58 // mov (%edx),%edi
- .byte 243,15,16,47 // movss (%edi),%xmm5
- .byte 243,15,16,119,4 // movss 0x4(%edi),%xmm6
- .byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6
- .byte 243,15,16,103,8 // movss 0x8(%edi),%xmm4
+ .byte 131,236,24 // sub $0x18,%esp
+ .byte 15,41,93,232 // movaps %xmm3,-0x18(%ebp)
+ .byte 15,40,217 // movaps %xmm1,%xmm3
+ .byte 15,40,200 // movaps %xmm0,%xmm1
+ .byte 232,0,0,0,0 // call 3605 <_sk_parametric_b_sse2+0x15>
+ .byte 90 // pop %edx
+ .byte 139,69,12 // mov 0xc(%ebp),%eax
+ .byte 139,8 // mov (%eax),%ecx
+ .byte 243,15,16,105,16 // movss 0x10(%ecx),%xmm5
+ .byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
+ .byte 243,15,16,97,12 // movss 0xc(%ecx),%xmm4
.byte 15,198,228,0 // shufps $0x0,%xmm4,%xmm4
+ .byte 15,89,226 // mulps %xmm2,%xmm4
+ .byte 243,15,16,113,4 // movss 0x4(%ecx),%xmm6
+ .byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6
.byte 15,89,242 // mulps %xmm2,%xmm6
- .byte 15,88,244 // addps %xmm4,%xmm6
+ .byte 15,194,213,2 // cmpleps %xmm5,%xmm2
+ .byte 243,15,16,105,24 // movss 0x18(%ecx),%xmm5
+ .byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
+ .byte 15,88,229 // addps %xmm5,%xmm4
+ .byte 243,15,16,105,8 // movss 0x8(%ecx),%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
- .byte 15,91,230 // cvtdq2ps %xmm6,%xmm4
- .byte 15,89,166,159,83,0,0 // mulps 0x539f(%esi),%xmm4
- .byte 15,84,182,175,83,0,0 // andps 0x53af(%esi),%xmm6
- .byte 15,86,182,191,83,0,0 // orps 0x53bf(%esi),%xmm6
- .byte 15,88,166,207,83,0,0 // addps 0x53cf(%esi),%xmm4
- .byte 15,40,190,223,83,0,0 // movaps 0x53df(%esi),%xmm7
+ .byte 15,88,245 // addps %xmm5,%xmm6
+ .byte 15,91,238 // cvtdq2ps %xmm6,%xmm5
+ .byte 15,89,170,59,64,0,0 // mulps 0x403b(%edx),%xmm5
+ .byte 15,84,178,75,64,0,0 // andps 0x404b(%edx),%xmm6
+ .byte 15,86,178,91,64,0,0 // orps 0x405b(%edx),%xmm6
+ .byte 15,88,170,107,64,0,0 // addps 0x406b(%edx),%xmm5
+ .byte 15,40,186,123,64,0,0 // movaps 0x407b(%edx),%xmm7
.byte 15,89,254 // mulps %xmm6,%xmm7
- .byte 15,92,231 // subps %xmm7,%xmm4
- .byte 15,88,182,239,83,0,0 // addps 0x53ef(%esi),%xmm6
- .byte 15,40,190,255,83,0,0 // movaps 0x53ff(%esi),%xmm7
- .byte 15,94,254 // divps %xmm6,%xmm7
- .byte 15,92,231 // subps %xmm7,%xmm4
- .byte 15,89,229 // mulps %xmm5,%xmm4
- .byte 243,15,91,236 // cvttps2dq %xmm4,%xmm5
- .byte 15,91,245 // cvtdq2ps %xmm5,%xmm6
- .byte 15,40,252 // movaps %xmm4,%xmm7
- .byte 15,194,254,1 // cmpltps %xmm6,%xmm7
- .byte 15,40,174,15,84,0,0 // movaps 0x540f(%esi),%xmm5
- .byte 15,84,253 // andps %xmm5,%xmm7
- .byte 15,92,247 // subps %xmm7,%xmm6
- .byte 15,40,252 // movaps %xmm4,%xmm7
- .byte 15,92,254 // subps %xmm6,%xmm7
- .byte 15,88,166,31,84,0,0 // addps 0x541f(%esi),%xmm4
- .byte 15,40,182,47,84,0,0 // movaps 0x542f(%esi),%xmm6
- .byte 15,89,247 // mulps %xmm7,%xmm6
- .byte 15,92,230 // subps %xmm6,%xmm4
- .byte 15,40,182,63,84,0,0 // movaps 0x543f(%esi),%xmm6
- .byte 15,92,247 // subps %xmm7,%xmm6
- .byte 15,40,190,79,84,0,0 // movaps 0x544f(%esi),%xmm7
+ .byte 15,92,239 // subps %xmm7,%xmm5
+ .byte 15,88,178,139,64,0,0 // addps 0x408b(%edx),%xmm6
+ .byte 15,40,186,155,64,0,0 // movaps 0x409b(%edx),%xmm7
.byte 15,94,254 // divps %xmm6,%xmm7
- .byte 15,88,252 // addps %xmm4,%xmm7
- .byte 15,89,190,95,84,0,0 // mulps 0x545f(%esi),%xmm7
- .byte 139,117,20 // mov 0x14(%ebp),%esi
- .byte 243,15,16,103,16 // movss 0x10(%edi),%xmm4
- .byte 15,198,228,0 // shufps $0x0,%xmm4,%xmm4
- .byte 243,15,16,119,12 // movss 0xc(%edi),%xmm6
+ .byte 243,15,16,49 // movss (%ecx),%xmm6
.byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6
- .byte 15,89,242 // mulps %xmm2,%xmm6
- .byte 15,194,212,2 // cmpleps %xmm4,%xmm2
- .byte 243,15,16,103,24 // movss 0x18(%edi),%xmm4
- .byte 15,198,228,0 // shufps $0x0,%xmm4,%xmm4
- .byte 15,88,244 // addps %xmm4,%xmm6
- .byte 243,15,16,103,20 // movss 0x14(%edi),%xmm4
- .byte 139,125,24 // mov 0x18(%ebp),%edi
- .byte 102,15,91,255 // cvtps2dq %xmm7,%xmm7
- .byte 15,198,228,0 // shufps $0x0,%xmm4,%xmm4
- .byte 15,88,231 // addps %xmm7,%xmm4
- .byte 15,40,125,40 // movaps 0x28(%ebp),%xmm7
- .byte 15,84,242 // andps %xmm2,%xmm6
- .byte 15,85,212 // andnps %xmm4,%xmm2
- .byte 15,40,101,56 // movaps 0x38(%ebp),%xmm4
- .byte 15,86,214 // orps %xmm6,%xmm2
- .byte 15,87,246 // xorps %xmm6,%xmm6
- .byte 15,95,214 // maxps %xmm6,%xmm2
- .byte 15,40,117,72 // movaps 0x48(%ebp),%xmm6
- .byte 15,93,213 // minps %xmm5,%xmm2
- .byte 15,40,109,88 // movaps 0x58(%ebp),%xmm5
- .byte 141,90,8 // lea 0x8(%edx),%ebx
- .byte 15,41,108,36,80 // movaps %xmm5,0x50(%esp)
- .byte 15,41,116,36,64 // movaps %xmm6,0x40(%esp)
- .byte 15,41,100,36,48 // movaps %xmm4,0x30(%esp)
- .byte 15,41,124,36,32 // movaps %xmm7,0x20(%esp)
- .byte 137,124,36,16 // mov %edi,0x10(%esp)
- .byte 137,116,36,12 // mov %esi,0xc(%esp)
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
- .byte 255,82,4 // call *0x4(%edx)
- .byte 131,196,108 // add $0x6c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 15,92,239 // subps %xmm7,%xmm5
+ .byte 15,89,238 // mulps %xmm6,%xmm5
+ .byte 243,15,91,245 // cvttps2dq %xmm5,%xmm6
+ .byte 15,91,254 // cvtdq2ps %xmm6,%xmm7
+ .byte 15,40,197 // movaps %xmm5,%xmm0
+ .byte 15,194,199,1 // cmpltps %xmm7,%xmm0
+ .byte 15,40,178,171,64,0,0 // movaps 0x40ab(%edx),%xmm6
+ .byte 15,84,198 // andps %xmm6,%xmm0
+ .byte 15,92,248 // subps %xmm0,%xmm7
+ .byte 15,40,197 // movaps %xmm5,%xmm0
+ .byte 15,92,199 // subps %xmm7,%xmm0
+ .byte 15,88,170,187,64,0,0 // addps 0x40bb(%edx),%xmm5
+ .byte 15,40,186,203,64,0,0 // movaps 0x40cb(%edx),%xmm7
+ .byte 15,89,248 // mulps %xmm0,%xmm7
+ .byte 15,92,239 // subps %xmm7,%xmm5
+ .byte 15,40,186,219,64,0,0 // movaps 0x40db(%edx),%xmm7
+ .byte 15,92,248 // subps %xmm0,%xmm7
+ .byte 15,40,130,235,64,0,0 // movaps 0x40eb(%edx),%xmm0
+ .byte 15,94,199 // divps %xmm7,%xmm0
+ .byte 15,88,197 // addps %xmm5,%xmm0
+ .byte 15,89,130,251,64,0,0 // mulps 0x40fb(%edx),%xmm0
+ .byte 102,15,91,192 // cvtps2dq %xmm0,%xmm0
+ .byte 243,15,16,105,20 // movss 0x14(%ecx),%xmm5
+ .byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
+ .byte 15,88,232 // addps %xmm0,%xmm5
+ .byte 15,84,226 // andps %xmm2,%xmm4
+ .byte 15,85,213 // andnps %xmm5,%xmm2
+ .byte 15,86,212 // orps %xmm4,%xmm2
+ .byte 15,87,192 // xorps %xmm0,%xmm0
+ .byte 15,95,208 // maxps %xmm0,%xmm2
+ .byte 15,93,214 // minps %xmm6,%xmm2
+ .byte 141,72,8 // lea 0x8(%eax),%ecx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 15,40,193 // movaps %xmm1,%xmm0
+ .byte 15,40,203 // movaps %xmm3,%xmm1
+ .byte 15,40,93,232 // movaps -0x18(%ebp),%xmm3
+ .byte 81 // push %ecx
+ .byte 255,117,8 // pushl 0x8(%ebp)
+ .byte 255,80,4 // call *0x4(%eax)
+ .byte 131,196,40 // add $0x28,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -54417,96 +53252,82 @@ FUNCTION(_sk_parametric_a_sse2)
_sk_parametric_a_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 232,0,0,0,0 // call 46f3 <_sk_parametric_a_sse2+0xe>
- .byte 94 // pop %esi
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
- .byte 139,85,12 // mov 0xc(%ebp),%edx
- .byte 139,58 // mov (%edx),%edi
- .byte 243,15,16,47 // movss (%edi),%xmm5
- .byte 243,15,16,119,4 // movss 0x4(%edi),%xmm6
- .byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6
- .byte 243,15,16,103,8 // movss 0x8(%edi),%xmm4
+ .byte 131,236,24 // sub $0x18,%esp
+ .byte 15,41,85,232 // movaps %xmm2,-0x18(%ebp)
+ .byte 15,40,209 // movaps %xmm1,%xmm2
+ .byte 15,40,200 // movaps %xmm0,%xmm1
+ .byte 232,0,0,0,0 // call 3739 <_sk_parametric_a_sse2+0x15>
+ .byte 90 // pop %edx
+ .byte 139,69,12 // mov 0xc(%ebp),%eax
+ .byte 139,8 // mov (%eax),%ecx
+ .byte 243,15,16,105,16 // movss 0x10(%ecx),%xmm5
+ .byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
+ .byte 243,15,16,97,12 // movss 0xc(%ecx),%xmm4
.byte 15,198,228,0 // shufps $0x0,%xmm4,%xmm4
+ .byte 15,89,227 // mulps %xmm3,%xmm4
+ .byte 243,15,16,113,4 // movss 0x4(%ecx),%xmm6
+ .byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6
.byte 15,89,243 // mulps %xmm3,%xmm6
- .byte 15,88,244 // addps %xmm4,%xmm6
+ .byte 15,194,221,2 // cmpleps %xmm5,%xmm3
+ .byte 243,15,16,105,24 // movss 0x18(%ecx),%xmm5
+ .byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
+ .byte 15,88,229 // addps %xmm5,%xmm4
+ .byte 243,15,16,105,8 // movss 0x8(%ecx),%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
- .byte 15,91,230 // cvtdq2ps %xmm6,%xmm4
- .byte 15,89,166,13,83,0,0 // mulps 0x530d(%esi),%xmm4
- .byte 15,84,182,29,83,0,0 // andps 0x531d(%esi),%xmm6
- .byte 15,86,182,45,83,0,0 // orps 0x532d(%esi),%xmm6
- .byte 15,88,166,61,83,0,0 // addps 0x533d(%esi),%xmm4
- .byte 15,40,190,77,83,0,0 // movaps 0x534d(%esi),%xmm7
+ .byte 15,88,245 // addps %xmm5,%xmm6
+ .byte 15,91,238 // cvtdq2ps %xmm6,%xmm5
+ .byte 15,89,170,215,63,0,0 // mulps 0x3fd7(%edx),%xmm5
+ .byte 15,84,178,231,63,0,0 // andps 0x3fe7(%edx),%xmm6
+ .byte 15,86,178,247,63,0,0 // orps 0x3ff7(%edx),%xmm6
+ .byte 15,88,170,7,64,0,0 // addps 0x4007(%edx),%xmm5
+ .byte 15,40,186,23,64,0,0 // movaps 0x4017(%edx),%xmm7
.byte 15,89,254 // mulps %xmm6,%xmm7
- .byte 15,92,231 // subps %xmm7,%xmm4
- .byte 15,88,182,93,83,0,0 // addps 0x535d(%esi),%xmm6
- .byte 15,40,190,109,83,0,0 // movaps 0x536d(%esi),%xmm7
- .byte 15,94,254 // divps %xmm6,%xmm7
- .byte 15,92,231 // subps %xmm7,%xmm4
- .byte 15,89,229 // mulps %xmm5,%xmm4
- .byte 243,15,91,236 // cvttps2dq %xmm4,%xmm5
- .byte 15,91,245 // cvtdq2ps %xmm5,%xmm6
- .byte 15,40,252 // movaps %xmm4,%xmm7
- .byte 15,194,254,1 // cmpltps %xmm6,%xmm7
- .byte 15,40,174,125,83,0,0 // movaps 0x537d(%esi),%xmm5
- .byte 15,84,253 // andps %xmm5,%xmm7
- .byte 15,92,247 // subps %xmm7,%xmm6
- .byte 15,40,252 // movaps %xmm4,%xmm7
- .byte 15,92,254 // subps %xmm6,%xmm7
- .byte 15,88,166,141,83,0,0 // addps 0x538d(%esi),%xmm4
- .byte 15,40,182,157,83,0,0 // movaps 0x539d(%esi),%xmm6
- .byte 15,89,247 // mulps %xmm7,%xmm6
- .byte 15,92,230 // subps %xmm6,%xmm4
- .byte 15,40,182,173,83,0,0 // movaps 0x53ad(%esi),%xmm6
- .byte 15,92,247 // subps %xmm7,%xmm6
- .byte 15,40,190,189,83,0,0 // movaps 0x53bd(%esi),%xmm7
+ .byte 15,92,239 // subps %xmm7,%xmm5
+ .byte 15,88,178,39,64,0,0 // addps 0x4027(%edx),%xmm6
+ .byte 15,40,186,55,64,0,0 // movaps 0x4037(%edx),%xmm7
.byte 15,94,254 // divps %xmm6,%xmm7
- .byte 15,88,252 // addps %xmm4,%xmm7
- .byte 15,89,190,205,83,0,0 // mulps 0x53cd(%esi),%xmm7
- .byte 139,117,20 // mov 0x14(%ebp),%esi
- .byte 243,15,16,103,16 // movss 0x10(%edi),%xmm4
- .byte 15,198,228,0 // shufps $0x0,%xmm4,%xmm4
- .byte 243,15,16,119,12 // movss 0xc(%edi),%xmm6
+ .byte 243,15,16,49 // movss (%ecx),%xmm6
.byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6
- .byte 15,89,243 // mulps %xmm3,%xmm6
- .byte 15,194,220,2 // cmpleps %xmm4,%xmm3
- .byte 243,15,16,103,24 // movss 0x18(%edi),%xmm4
- .byte 15,198,228,0 // shufps $0x0,%xmm4,%xmm4
- .byte 15,88,244 // addps %xmm4,%xmm6
- .byte 243,15,16,103,20 // movss 0x14(%edi),%xmm4
- .byte 139,125,24 // mov 0x18(%ebp),%edi
- .byte 102,15,91,255 // cvtps2dq %xmm7,%xmm7
- .byte 15,198,228,0 // shufps $0x0,%xmm4,%xmm4
- .byte 15,88,231 // addps %xmm7,%xmm4
- .byte 15,40,125,40 // movaps 0x28(%ebp),%xmm7
- .byte 15,84,243 // andps %xmm3,%xmm6
- .byte 15,85,220 // andnps %xmm4,%xmm3
- .byte 15,40,101,56 // movaps 0x38(%ebp),%xmm4
- .byte 15,86,222 // orps %xmm6,%xmm3
- .byte 15,87,246 // xorps %xmm6,%xmm6
- .byte 15,95,222 // maxps %xmm6,%xmm3
- .byte 15,40,117,72 // movaps 0x48(%ebp),%xmm6
- .byte 15,93,221 // minps %xmm5,%xmm3
- .byte 15,40,109,88 // movaps 0x58(%ebp),%xmm5
- .byte 141,90,8 // lea 0x8(%edx),%ebx
- .byte 15,41,108,36,80 // movaps %xmm5,0x50(%esp)
- .byte 15,41,116,36,64 // movaps %xmm6,0x40(%esp)
- .byte 15,41,100,36,48 // movaps %xmm4,0x30(%esp)
- .byte 15,41,124,36,32 // movaps %xmm7,0x20(%esp)
- .byte 137,124,36,16 // mov %edi,0x10(%esp)
- .byte 137,116,36,12 // mov %esi,0xc(%esp)
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
- .byte 255,82,4 // call *0x4(%edx)
- .byte 131,196,108 // add $0x6c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 15,92,239 // subps %xmm7,%xmm5
+ .byte 15,89,238 // mulps %xmm6,%xmm5
+ .byte 243,15,91,245 // cvttps2dq %xmm5,%xmm6
+ .byte 15,91,254 // cvtdq2ps %xmm6,%xmm7
+ .byte 15,40,197 // movaps %xmm5,%xmm0
+ .byte 15,194,199,1 // cmpltps %xmm7,%xmm0
+ .byte 15,40,178,71,64,0,0 // movaps 0x4047(%edx),%xmm6
+ .byte 15,84,198 // andps %xmm6,%xmm0
+ .byte 15,92,248 // subps %xmm0,%xmm7
+ .byte 15,40,197 // movaps %xmm5,%xmm0
+ .byte 15,92,199 // subps %xmm7,%xmm0
+ .byte 15,88,170,87,64,0,0 // addps 0x4057(%edx),%xmm5
+ .byte 15,40,186,103,64,0,0 // movaps 0x4067(%edx),%xmm7
+ .byte 15,89,248 // mulps %xmm0,%xmm7
+ .byte 15,92,239 // subps %xmm7,%xmm5
+ .byte 15,40,186,119,64,0,0 // movaps 0x4077(%edx),%xmm7
+ .byte 15,92,248 // subps %xmm0,%xmm7
+ .byte 15,40,130,135,64,0,0 // movaps 0x4087(%edx),%xmm0
+ .byte 15,94,199 // divps %xmm7,%xmm0
+ .byte 15,88,197 // addps %xmm5,%xmm0
+ .byte 15,89,130,151,64,0,0 // mulps 0x4097(%edx),%xmm0
+ .byte 102,15,91,192 // cvtps2dq %xmm0,%xmm0
+ .byte 243,15,16,105,20 // movss 0x14(%ecx),%xmm5
+ .byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
+ .byte 15,88,232 // addps %xmm0,%xmm5
+ .byte 15,84,227 // andps %xmm3,%xmm4
+ .byte 15,85,221 // andnps %xmm5,%xmm3
+ .byte 15,86,220 // orps %xmm4,%xmm3
+ .byte 15,87,192 // xorps %xmm0,%xmm0
+ .byte 15,95,216 // maxps %xmm0,%xmm3
+ .byte 15,93,222 // minps %xmm6,%xmm3
+ .byte 141,72,8 // lea 0x8(%eax),%ecx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 15,40,193 // movaps %xmm1,%xmm0
+ .byte 15,40,202 // movaps %xmm2,%xmm1
+ .byte 15,40,85,232 // movaps -0x18(%ebp),%xmm2
+ .byte 81 // push %ecx
+ .byte 255,117,8 // pushl 0x8(%ebp)
+ .byte 255,80,4 // call *0x4(%eax)
+ .byte 131,196,40 // add $0x28,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -54516,38 +53337,35 @@ FUNCTION(_sk_lab_to_xyz_sse2)
_sk_lab_to_xyz_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 131,236,124 // sub $0x7c,%esp
- .byte 15,41,93,216 // movaps %xmm3,-0x28(%ebp)
+ .byte 131,236,24 // sub $0x18,%esp
+ .byte 15,41,93,232 // movaps %xmm3,-0x18(%ebp)
.byte 15,40,218 // movaps %xmm2,%xmm3
.byte 15,40,208 // movaps %xmm0,%xmm2
- .byte 232,0,0,0,0 // call 485f <_sk_lab_to_xyz_sse2+0x18>
+ .byte 232,0,0,0,0 // call 386d <_sk_lab_to_xyz_sse2+0x15>
.byte 88 // pop %eax
- .byte 15,89,144,113,82,0,0 // mulps 0x5271(%eax),%xmm2
- .byte 15,40,160,129,82,0,0 // movaps 0x5281(%eax),%xmm4
+ .byte 15,89,144,115,63,0,0 // mulps 0x3f73(%eax),%xmm2
+ .byte 15,40,160,131,63,0,0 // movaps 0x3f83(%eax),%xmm4
.byte 15,89,204 // mulps %xmm4,%xmm1
- .byte 15,40,168,145,82,0,0 // movaps 0x5291(%eax),%xmm5
+ .byte 15,40,168,147,63,0,0 // movaps 0x3f93(%eax),%xmm5
.byte 15,88,205 // addps %xmm5,%xmm1
.byte 15,89,220 // mulps %xmm4,%xmm3
.byte 15,88,221 // addps %xmm5,%xmm3
- .byte 15,88,144,161,82,0,0 // addps 0x52a1(%eax),%xmm2
- .byte 15,89,144,177,82,0,0 // mulps 0x52b1(%eax),%xmm2
- .byte 15,89,136,193,82,0,0 // mulps 0x52c1(%eax),%xmm1
+ .byte 15,88,144,163,63,0,0 // addps 0x3fa3(%eax),%xmm2
+ .byte 15,89,144,179,63,0,0 // mulps 0x3fb3(%eax),%xmm2
+ .byte 15,89,136,195,63,0,0 // mulps 0x3fc3(%eax),%xmm1
.byte 15,88,202 // addps %xmm2,%xmm1
- .byte 15,89,152,209,82,0,0 // mulps 0x52d1(%eax),%xmm3
+ .byte 15,89,152,211,63,0,0 // mulps 0x3fd3(%eax),%xmm3
.byte 15,40,234 // movaps %xmm2,%xmm5
.byte 15,92,235 // subps %xmm3,%xmm5
.byte 15,40,193 // movaps %xmm1,%xmm0
.byte 15,89,192 // mulps %xmm0,%xmm0
.byte 15,89,193 // mulps %xmm1,%xmm0
- .byte 15,40,152,225,82,0,0 // movaps 0x52e1(%eax),%xmm3
+ .byte 15,40,152,227,63,0,0 // movaps 0x3fe3(%eax),%xmm3
.byte 15,40,227 // movaps %xmm3,%xmm4
.byte 15,194,224,1 // cmpltps %xmm0,%xmm4
- .byte 15,40,176,241,82,0,0 // movaps 0x52f1(%eax),%xmm6
+ .byte 15,40,176,243,63,0,0 // movaps 0x3ff3(%eax),%xmm6
.byte 15,88,206 // addps %xmm6,%xmm1
- .byte 15,40,184,1,83,0,0 // movaps 0x5301(%eax),%xmm7
+ .byte 15,40,184,3,64,0,0 // movaps 0x4003(%eax),%xmm7
.byte 15,89,207 // mulps %xmm7,%xmm1
.byte 15,84,196 // andps %xmm4,%xmm0
.byte 15,85,225 // andnps %xmm1,%xmm4
@@ -54561,45 +53379,28 @@ _sk_lab_to_xyz_sse2:
.byte 15,89,215 // mulps %xmm7,%xmm2
.byte 15,84,193 // andps %xmm1,%xmm0
.byte 15,85,202 // andnps %xmm2,%xmm1
- .byte 139,77,8 // mov 0x8(%ebp),%ecx
- .byte 139,85,16 // mov 0x10(%ebp),%edx
- .byte 139,117,20 // mov 0x14(%ebp),%esi
- .byte 139,125,24 // mov 0x18(%ebp),%edi
.byte 15,86,200 // orps %xmm0,%xmm1
.byte 15,40,197 // movaps %xmm5,%xmm0
.byte 15,89,192 // mulps %xmm0,%xmm0
.byte 15,89,197 // mulps %xmm5,%xmm0
.byte 15,88,238 // addps %xmm6,%xmm5
- .byte 15,40,85,40 // movaps 0x28(%ebp),%xmm2
.byte 15,89,239 // mulps %xmm7,%xmm5
- .byte 15,40,117,56 // movaps 0x38(%ebp),%xmm6
.byte 15,194,216,1 // cmpltps %xmm0,%xmm3
.byte 15,84,195 // andps %xmm3,%xmm0
.byte 15,85,221 // andnps %xmm5,%xmm3
- .byte 15,40,109,72 // movaps 0x48(%ebp),%xmm5
.byte 15,86,216 // orps %xmm0,%xmm3
- .byte 15,40,69,88 // movaps 0x58(%ebp),%xmm0
- .byte 15,89,160,17,83,0,0 // mulps 0x5311(%eax),%xmm4
- .byte 15,89,152,33,83,0,0 // mulps 0x5321(%eax),%xmm3
- .byte 139,69,12 // mov 0xc(%ebp),%eax
- .byte 141,88,4 // lea 0x4(%eax),%ebx
- .byte 15,41,68,36,80 // movaps %xmm0,0x50(%esp)
- .byte 15,41,108,36,64 // movaps %xmm5,0x40(%esp)
- .byte 15,41,116,36,48 // movaps %xmm6,0x30(%esp)
- .byte 15,41,84,36,32 // movaps %xmm2,0x20(%esp)
- .byte 137,124,36,16 // mov %edi,0x10(%esp)
- .byte 137,116,36,12 // mov %esi,0xc(%esp)
- .byte 137,84,36,8 // mov %edx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,12,36 // mov %ecx,(%esp)
+ .byte 139,77,12 // mov 0xc(%ebp),%ecx
+ .byte 15,89,160,19,64,0,0 // mulps 0x4013(%eax),%xmm4
+ .byte 15,89,152,35,64,0,0 // mulps 0x4023(%eax),%xmm3
+ .byte 141,65,4 // lea 0x4(%ecx),%eax
+ .byte 131,236,8 // sub $0x8,%esp
.byte 15,40,196 // movaps %xmm4,%xmm0
.byte 15,40,211 // movaps %xmm3,%xmm2
- .byte 15,40,93,216 // movaps -0x28(%ebp),%xmm3
- .byte 255,16 // call *(%eax)
- .byte 131,196,124 // add $0x7c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 15,40,93,232 // movaps -0x18(%ebp),%xmm3
+ .byte 80 // push %eax
+ .byte 255,117,8 // pushl 0x8(%ebp)
+ .byte 255,17 // call *(%ecx)
+ .byte 131,196,40 // add $0x28,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -54612,71 +53413,59 @@ _sk_load_a8_sse2:
.byte 83 // push %ebx
.byte 87 // push %edi
.byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 232,0,0,0,0 // call 498e <_sk_load_a8_sse2+0xe>
+ .byte 131,236,12 // sub $0xc,%esp
+ .byte 232,0,0,0,0 // call 395d <_sk_load_a8_sse2+0xe>
.byte 90 // pop %edx
- .byte 15,40,101,88 // movaps 0x58(%ebp),%xmm4
- .byte 15,40,85,72 // movaps 0x48(%ebp),%xmm2
- .byte 15,40,77,56 // movaps 0x38(%ebp),%xmm1
- .byte 102,15,111,69,40 // movdqa 0x28(%ebp),%xmm0
.byte 139,69,12 // mov 0xc(%ebp),%eax
+ .byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 139,56 // mov (%eax),%edi
.byte 139,119,4 // mov 0x4(%edi),%esi
- .byte 15,175,117,20 // imul 0x14(%ebp),%esi
+ .byte 15,175,113,4 // imul 0x4(%ecx),%esi
.byte 3,55 // add (%edi),%esi
- .byte 139,93,24 // mov 0x18(%ebp),%ebx
+ .byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
- .byte 139,125,16 // mov 0x10(%ebp),%edi
- .byte 117,101 // jne 4a1d <_sk_load_a8_sse2+0x9d>
- .byte 102,15,110,28,62 // movd (%esi,%edi,1),%xmm3
- .byte 102,15,96,216 // punpcklbw %xmm0,%xmm3
- .byte 102,15,97,216 // punpcklwd %xmm0,%xmm3
- .byte 102,15,219,154,2,82,0,0 // pand 0x5202(%edx),%xmm3
- .byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,154,18,82,0,0 // mulps 0x5212(%edx),%xmm3
- .byte 141,72,8 // lea 0x8(%eax),%ecx
- .byte 15,41,100,36,80 // movaps %xmm4,0x50(%esp)
- .byte 15,41,84,36,64 // movaps %xmm2,0x40(%esp)
- .byte 15,41,76,36,48 // movaps %xmm1,0x30(%esp)
- .byte 102,15,127,68,36,32 // movdqa %xmm0,0x20(%esp)
- .byte 137,92,36,16 // mov %ebx,0x10(%esp)
- .byte 139,85,20 // mov 0x14(%ebp),%edx
- .byte 137,84,36,12 // mov %edx,0xc(%esp)
- .byte 137,124,36,8 // mov %edi,0x8(%esp)
- .byte 137,76,36,4 // mov %ecx,0x4(%esp)
- .byte 139,77,8 // mov 0x8(%ebp),%ecx
- .byte 137,12,36 // mov %ecx,(%esp)
- .byte 102,15,239,192 // pxor %xmm0,%xmm0
- .byte 15,87,201 // xorps %xmm1,%xmm1
+ .byte 139,57 // mov (%ecx),%edi
+ .byte 117,60 // jne 39b4 <_sk_load_a8_sse2+0x65>
+ .byte 102,15,110,4,62 // movd (%esi,%edi,1),%xmm0
+ .byte 102,15,96,192 // punpcklbw %xmm0,%xmm0
+ .byte 102,15,97,192 // punpcklwd %xmm0,%xmm0
+ .byte 102,15,219,130,67,63,0,0 // pand 0x3f43(%edx),%xmm0
+ .byte 15,91,216 // cvtdq2ps %xmm0,%xmm3
+ .byte 15,89,154,83,63,0,0 // mulps 0x3f53(%edx),%xmm3
+ .byte 141,80,8 // lea 0x8(%eax),%edx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 15,87,192 // xorps %xmm0,%xmm0
+ .byte 102,15,87,201 // xorpd %xmm1,%xmm1
.byte 15,87,210 // xorps %xmm2,%xmm2
+ .byte 82 // push %edx
+ .byte 81 // push %ecx
.byte 255,80,4 // call *0x4(%eax)
- .byte 131,196,108 // add $0x6c,%esp
+ .byte 131,196,28 // add $0x1c,%esp
.byte 94 // pop %esi
.byte 95 // pop %edi
.byte 91 // pop %ebx
.byte 93 // pop %ebp
.byte 195 // ret
- .byte 137,217 // mov %ebx,%ecx
- .byte 128,225,3 // and $0x3,%cl
- .byte 128,249,1 // cmp $0x1,%cl
- .byte 116,53 // je 4a5c <_sk_load_a8_sse2+0xdc>
- .byte 102,15,239,219 // pxor %xmm3,%xmm3
- .byte 128,249,2 // cmp $0x2,%cl
- .byte 116,19 // je 4a43 <_sk_load_a8_sse2+0xc3>
- .byte 128,249,3 // cmp $0x3,%cl
- .byte 117,144 // jne 49c5 <_sk_load_a8_sse2+0x45>
- .byte 15,182,76,62,2 // movzbl 0x2(%esi,%edi,1),%ecx
- .byte 102,15,110,217 // movd %ecx,%xmm3
- .byte 102,15,112,219,69 // pshufd $0x45,%xmm3,%xmm3
- .byte 15,183,12,62 // movzwl (%esi,%edi,1),%ecx
- .byte 102,15,110,233 // movd %ecx,%xmm5
- .byte 102,15,96,232 // punpcklbw %xmm0,%xmm5
- .byte 102,15,97,232 // punpcklwd %xmm0,%xmm5
- .byte 242,15,16,221 // movsd %xmm5,%xmm3
- .byte 233,105,255,255,255 // jmp 49c5 <_sk_load_a8_sse2+0x45>
- .byte 15,182,12,62 // movzbl (%esi,%edi,1),%ecx
- .byte 102,15,110,217 // movd %ecx,%xmm3
- .byte 233,92,255,255,255 // jmp 49c5 <_sk_load_a8_sse2+0x45>
+ .byte 128,227,3 // and $0x3,%bl
+ .byte 128,251,1 // cmp $0x1,%bl
+ .byte 116,50 // je 39ee <_sk_load_a8_sse2+0x9f>
+ .byte 102,15,239,192 // pxor %xmm0,%xmm0
+ .byte 128,251,2 // cmp $0x2,%bl
+ .byte 116,19 // je 39d8 <_sk_load_a8_sse2+0x89>
+ .byte 128,251,3 // cmp $0x3,%bl
+ .byte 117,187 // jne 3985 <_sk_load_a8_sse2+0x36>
+ .byte 15,182,92,62,2 // movzbl 0x2(%esi,%edi,1),%ebx
+ .byte 102,15,110,195 // movd %ebx,%xmm0
+ .byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0
+ .byte 15,183,52,62 // movzwl (%esi,%edi,1),%esi
+ .byte 102,15,110,206 // movd %esi,%xmm1
+ .byte 102,15,96,200 // punpcklbw %xmm0,%xmm1
+ .byte 102,15,97,200 // punpcklwd %xmm0,%xmm1
+ .byte 242,15,16,193 // movsd %xmm1,%xmm0
+ .byte 235,151 // jmp 3985 <_sk_load_a8_sse2+0x36>
+ .byte 15,182,52,62 // movzbl (%esi,%edi,1),%esi
+ .byte 102,15,110,198 // movd %esi,%xmm0
+ .byte 235,141 // jmp 3985 <_sk_load_a8_sse2+0x36>
HIDDEN _sk_load_a8_dst_sse2
.globl _sk_load_a8_dst_sse2
@@ -54687,65 +53476,60 @@ _sk_load_a8_dst_sse2:
.byte 83 // push %ebx
.byte 87 // push %edi
.byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 232,0,0,0,0 // call 4a77 <_sk_load_a8_dst_sse2+0xe>
- .byte 90 // pop %edx
+ .byte 131,236,12 // sub $0xc,%esp
.byte 139,69,12 // mov 0xc(%ebp),%eax
- .byte 139,56 // mov (%eax),%edi
- .byte 139,119,4 // mov 0x4(%edi),%esi
- .byte 15,175,117,20 // imul 0x14(%ebp),%esi
- .byte 3,55 // add (%edi),%esi
- .byte 139,93,24 // mov 0x18(%ebp),%ebx
+ .byte 139,77,8 // mov 0x8(%ebp),%ecx
+ .byte 139,49 // mov (%ecx),%esi
+ .byte 139,16 // mov (%eax),%edx
+ .byte 139,122,4 // mov 0x4(%edx),%edi
+ .byte 15,175,121,4 // imul 0x4(%ecx),%edi
+ .byte 3,58 // add (%edx),%edi
+ .byte 139,89,8 // mov 0x8(%ecx),%ebx
+ .byte 102,15,239,228 // pxor %xmm4,%xmm4
+ .byte 102,15,127,97,48 // movdqa %xmm4,0x30(%ecx)
+ .byte 102,15,127,97,32 // movdqa %xmm4,0x20(%ecx)
+ .byte 102,15,127,97,16 // movdqa %xmm4,0x10(%ecx)
.byte 133,219 // test %ebx,%ebx
- .byte 139,125,16 // mov 0x10(%ebp),%edi
- .byte 117,97 // jne 4af1 <_sk_load_a8_dst_sse2+0x88>
- .byte 102,15,110,36,62 // movd (%esi,%edi,1),%xmm4
+ .byte 232,0,0,0,0 // call 3a31 <_sk_load_a8_dst_sse2+0x39>
+ .byte 90 // pop %edx
+ .byte 117,54 // jne 3a6a <_sk_load_a8_dst_sse2+0x72>
+ .byte 102,15,110,36,55 // movd (%edi,%esi,1),%xmm4
.byte 102,15,96,224 // punpcklbw %xmm0,%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
- .byte 102,15,219,162,57,81,0,0 // pand 0x5139(%edx),%xmm4
+ .byte 102,15,219,162,143,62,0,0 // pand 0x3e8f(%edx),%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 102,15,87,237 // xorpd %xmm5,%xmm5
- .byte 15,89,162,73,81,0,0 // mulps 0x5149(%edx),%xmm4
- .byte 141,72,8 // lea 0x8(%eax),%ecx
- .byte 102,15,41,108,36,64 // movapd %xmm5,0x40(%esp)
- .byte 102,15,41,108,36,48 // movapd %xmm5,0x30(%esp)
- .byte 102,15,41,108,36,32 // movapd %xmm5,0x20(%esp)
- .byte 137,92,36,16 // mov %ebx,0x10(%esp)
- .byte 139,85,20 // mov 0x14(%ebp),%edx
- .byte 137,84,36,12 // mov %edx,0xc(%esp)
- .byte 137,124,36,8 // mov %edi,0x8(%esp)
- .byte 137,76,36,4 // mov %ecx,0x4(%esp)
- .byte 139,77,8 // mov 0x8(%ebp),%ecx
- .byte 137,12,36 // mov %ecx,(%esp)
- .byte 15,41,100,36,80 // movaps %xmm4,0x50(%esp)
+ .byte 15,89,162,159,62,0,0 // mulps 0x3e9f(%edx),%xmm4
+ .byte 15,41,97,64 // movaps %xmm4,0x40(%ecx)
+ .byte 141,80,8 // lea 0x8(%eax),%edx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 82 // push %edx
+ .byte 81 // push %ecx
.byte 255,80,4 // call *0x4(%eax)
- .byte 131,196,108 // add $0x6c,%esp
+ .byte 131,196,28 // add $0x1c,%esp
.byte 94 // pop %esi
.byte 95 // pop %edi
.byte 91 // pop %ebx
.byte 93 // pop %ebp
.byte 195 // ret
- .byte 137,217 // mov %ebx,%ecx
- .byte 128,225,3 // and $0x3,%cl
- .byte 128,249,1 // cmp $0x1,%cl
- .byte 116,53 // je 4b30 <_sk_load_a8_dst_sse2+0xc7>
- .byte 102,15,239,228 // pxor %xmm4,%xmm4
- .byte 128,249,2 // cmp $0x2,%cl
- .byte 116,19 // je 4b17 <_sk_load_a8_dst_sse2+0xae>
- .byte 128,249,3 // cmp $0x3,%cl
- .byte 117,148 // jne 4a9d <_sk_load_a8_dst_sse2+0x34>
- .byte 15,182,76,62,2 // movzbl 0x2(%esi,%edi,1),%ecx
- .byte 102,15,110,225 // movd %ecx,%xmm4
+ .byte 128,227,3 // and $0x3,%bl
+ .byte 128,251,1 // cmp $0x1,%bl
+ .byte 116,46 // je 3aa0 <_sk_load_a8_dst_sse2+0xa8>
+ .byte 128,251,2 // cmp $0x2,%bl
+ .byte 116,19 // je 3a8a <_sk_load_a8_dst_sse2+0x92>
+ .byte 128,251,3 // cmp $0x3,%bl
+ .byte 117,197 // jne 3a41 <_sk_load_a8_dst_sse2+0x49>
+ .byte 15,182,92,55,2 // movzbl 0x2(%edi,%esi,1),%ebx
+ .byte 102,15,110,227 // movd %ebx,%xmm4
.byte 102,15,112,228,69 // pshufd $0x45,%xmm4,%xmm4
- .byte 15,183,12,62 // movzwl (%esi,%edi,1),%ecx
- .byte 102,15,110,233 // movd %ecx,%xmm5
+ .byte 15,183,52,55 // movzwl (%edi,%esi,1),%esi
+ .byte 102,15,110,238 // movd %esi,%xmm5
.byte 102,15,96,232 // punpcklbw %xmm0,%xmm5
.byte 102,15,97,232 // punpcklwd %xmm0,%xmm5
.byte 242,15,16,229 // movsd %xmm5,%xmm4
- .byte 233,109,255,255,255 // jmp 4a9d <_sk_load_a8_dst_sse2+0x34>
- .byte 15,182,12,62 // movzbl (%esi,%edi,1),%ecx
- .byte 102,15,110,225 // movd %ecx,%xmm4
- .byte 233,96,255,255,255 // jmp 4a9d <_sk_load_a8_dst_sse2+0x34>
+ .byte 235,161 // jmp 3a41 <_sk_load_a8_dst_sse2+0x49>
+ .byte 15,182,52,55 // movzbl (%edi,%esi,1),%esi
+ .byte 102,15,110,230 // movd %esi,%xmm4
+ .byte 235,151 // jmp 3a41 <_sk_load_a8_dst_sse2+0x49>
HIDDEN _sk_gather_a8_sse2
.globl _sk_gather_a8_sse2
@@ -54753,10 +53537,8 @@ FUNCTION(_sk_gather_a8_sse2)
_sk_gather_a8_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
.byte 87 // push %edi
.byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,8 // mov (%eax),%ecx
.byte 139,17 // mov (%ecx),%edx
@@ -54784,43 +53566,28 @@ _sk_gather_a8_sse2:
.byte 102,15,126,206 // movd %xmm1,%esi
.byte 15,182,12,10 // movzbl (%edx,%ecx,1),%ecx
.byte 15,182,20,50 // movzbl (%edx,%esi,1),%edx
- .byte 232,0,0,0,0 // call 4bb7 <_sk_gather_a8_sse2+0x7a>
- .byte 94 // pop %esi
.byte 193,226,8 // shl $0x8,%edx
.byte 9,202 // or %ecx,%edx
- .byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 102,15,196,194,0 // pinsrw $0x0,%edx,%xmm0
- .byte 139,85,16 // mov 0x10(%ebp),%edx
.byte 102,15,196,199,1 // pinsrw $0x1,%edi,%xmm0
- .byte 139,125,20 // mov 0x14(%ebp),%edi
+ .byte 232,0,0,0,0 // call 3b2f <_sk_gather_a8_sse2+0x85>
+ .byte 89 // pop %ecx
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 102,15,96,193 // punpcklbw %xmm1,%xmm0
.byte 102,15,97,193 // punpcklwd %xmm1,%xmm0
.byte 15,91,216 // cvtdq2ps %xmm0,%xmm3
- .byte 15,89,158,25,80,0,0 // mulps 0x5019(%esi),%xmm3
- .byte 139,117,24 // mov 0x18(%ebp),%esi
- .byte 15,40,69,40 // movaps 0x28(%ebp),%xmm0
- .byte 15,40,77,56 // movaps 0x38(%ebp),%xmm1
- .byte 15,40,85,72 // movaps 0x48(%ebp),%xmm2
- .byte 15,40,101,88 // movaps 0x58(%ebp),%xmm4
- .byte 141,88,8 // lea 0x8(%eax),%ebx
- .byte 15,41,100,36,80 // movaps %xmm4,0x50(%esp)
- .byte 15,41,84,36,64 // movaps %xmm2,0x40(%esp)
- .byte 15,41,76,36,48 // movaps %xmm1,0x30(%esp)
- .byte 15,41,68,36,32 // movaps %xmm0,0x20(%esp)
- .byte 137,116,36,16 // mov %esi,0x10(%esp)
- .byte 137,124,36,12 // mov %edi,0xc(%esp)
- .byte 137,84,36,8 // mov %edx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,12,36 // mov %ecx,(%esp)
+ .byte 15,89,153,177,61,0,0 // mulps 0x3db1(%ecx),%xmm3
+ .byte 141,72,8 // lea 0x8(%eax),%ecx
+ .byte 131,236,8 // sub $0x8,%esp
.byte 15,87,192 // xorps %xmm0,%xmm0
- .byte 15,87,201 // xorps %xmm1,%xmm1
- .byte 15,87,210 // xorps %xmm2,%xmm2
+ .byte 102,15,239,201 // pxor %xmm1,%xmm1
+ .byte 102,15,239,210 // pxor %xmm2,%xmm2
+ .byte 81 // push %ecx
+ .byte 255,117,8 // pushl 0x8(%ebp)
.byte 255,80,4 // call *0x4(%eax)
- .byte 131,196,108 // add $0x6c,%esp
+ .byte 131,196,16 // add $0x10,%esp
.byte 94 // pop %esi
.byte 95 // pop %edi
- .byte 91 // pop %ebx
.byte 93 // pop %ebp
.byte 195 // ret
@@ -54833,45 +53600,34 @@ _sk_store_a8_sse2:
.byte 83 // push %ebx
.byte 87 // push %edi
.byte 86 // push %esi
- .byte 129,236,156,0,0,0 // sub $0x9c,%esp
- .byte 232,0,0,0,0 // call 4c48 <_sk_store_a8_sse2+0x11>
- .byte 95 // pop %edi
- .byte 15,40,117,88 // movaps 0x58(%ebp),%xmm6
- .byte 15,40,109,72 // movaps 0x48(%ebp),%xmm5
+ .byte 131,236,60 // sub $0x3c,%esp
+ .byte 232,0,0,0,0 // call 3b73 <_sk_store_a8_sse2+0xe>
+ .byte 94 // pop %esi
.byte 139,69,12 // mov 0xc(%ebp),%eax
- .byte 139,16 // mov (%eax),%edx
- .byte 139,114,4 // mov 0x4(%edx),%esi
- .byte 15,175,117,20 // imul 0x14(%ebp),%esi
- .byte 3,50 // add (%edx),%esi
- .byte 139,85,24 // mov 0x18(%ebp),%edx
- .byte 15,40,167,152,79,0,0 // movaps 0x4f98(%edi),%xmm4
+ .byte 139,77,8 // mov 0x8(%ebp),%ecx
+ .byte 139,56 // mov (%eax),%edi
+ .byte 139,87,4 // mov 0x4(%edi),%edx
+ .byte 15,175,81,4 // imul 0x4(%ecx),%edx
+ .byte 3,23 // add (%edi),%edx
+ .byte 139,89,8 // mov 0x8(%ecx),%ebx
+ .byte 15,40,166,125,61,0,0 // movaps 0x3d7d(%esi),%xmm4
.byte 15,89,227 // mulps %xmm3,%xmm4
.byte 102,15,91,228 // cvtps2dq %xmm4,%xmm4
.byte 102,15,114,244,16 // pslld $0x10,%xmm4
.byte 102,15,114,228,16 // psrad $0x10,%xmm4
.byte 102,15,107,228 // packssdw %xmm4,%xmm4
.byte 102,15,103,228 // packuswb %xmm4,%xmm4
- .byte 133,210 // test %edx,%edx
- .byte 139,93,16 // mov 0x10(%ebp),%ebx
- .byte 15,40,125,40 // movaps 0x28(%ebp),%xmm7
- .byte 117,73 // jne 4cd6 <_sk_store_a8_sse2+0x9f>
- .byte 102,15,126,225 // movd %xmm4,%ecx
- .byte 137,12,30 // mov %ecx,(%esi,%ebx,1)
- .byte 141,72,8 // lea 0x8(%eax),%ecx
- .byte 15,41,116,36,80 // movaps %xmm6,0x50(%esp)
- .byte 15,41,108,36,64 // movaps %xmm5,0x40(%esp)
- .byte 15,40,101,56 // movaps 0x38(%ebp),%xmm4
- .byte 15,41,100,36,48 // movaps %xmm4,0x30(%esp)
- .byte 15,41,124,36,32 // movaps %xmm7,0x20(%esp)
- .byte 137,84,36,16 // mov %edx,0x10(%esp)
- .byte 139,85,20 // mov 0x14(%ebp),%edx
- .byte 137,84,36,12 // mov %edx,0xc(%esp)
- .byte 137,92,36,8 // mov %ebx,0x8(%esp)
- .byte 137,76,36,4 // mov %ecx,0x4(%esp)
- .byte 139,77,8 // mov 0x8(%ebp),%ecx
- .byte 137,12,36 // mov %ecx,(%esp)
+ .byte 133,219 // test %ebx,%ebx
+ .byte 139,57 // mov (%ecx),%edi
+ .byte 117,26 // jne 3bc8 <_sk_store_a8_sse2+0x63>
+ .byte 102,15,126,230 // movd %xmm4,%esi
+ .byte 137,52,58 // mov %esi,(%edx,%edi,1)
+ .byte 141,80,8 // lea 0x8(%eax),%edx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 82 // push %edx
+ .byte 81 // push %ecx
.byte 255,80,4 // call *0x4(%eax)
- .byte 129,196,156,0,0,0 // add $0x9c,%esp
+ .byte 131,196,76 // add $0x4c,%esp
.byte 94 // pop %esi
.byte 95 // pop %edi
.byte 91 // pop %ebx
@@ -54879,29 +53635,28 @@ _sk_store_a8_sse2:
.byte 195 // ret
.byte 102,15,96,224 // punpcklbw %xmm0,%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
- .byte 137,209 // mov %edx,%ecx
- .byte 128,225,3 // and $0x3,%cl
- .byte 128,249,1 // cmp $0x1,%cl
- .byte 116,60 // je 4d24 <_sk_store_a8_sse2+0xed>
- .byte 128,249,2 // cmp $0x2,%cl
- .byte 116,17 // je 4cfe <_sk_store_a8_sse2+0xc7>
- .byte 128,249,3 // cmp $0x3,%cl
- .byte 117,162 // jne 4c94 <_sk_store_a8_sse2+0x5d>
+ .byte 128,227,3 // and $0x3,%bl
+ .byte 128,251,1 // cmp $0x1,%bl
+ .byte 116,57 // je 3c11 <_sk_store_a8_sse2+0xac>
+ .byte 128,251,2 // cmp $0x2,%bl
+ .byte 116,17 // je 3bee <_sk_store_a8_sse2+0x89>
+ .byte 128,251,3 // cmp $0x3,%bl
+ .byte 117,211 // jne 3bb5 <_sk_store_a8_sse2+0x50>
.byte 102,15,127,101,200 // movdqa %xmm4,-0x38(%ebp)
- .byte 138,77,208 // mov -0x30(%ebp),%cl
- .byte 136,76,30,2 // mov %cl,0x2(%esi,%ebx,1)
+ .byte 138,93,208 // mov -0x30(%ebp),%bl
+ .byte 136,92,58,2 // mov %bl,0x2(%edx,%edi,1)
.byte 102,15,112,228,212 // pshufd $0xd4,%xmm4,%xmm4
- .byte 102,15,219,167,168,79,0,0 // pand 0x4fa8(%edi),%xmm4
+ .byte 102,15,219,166,141,61,0,0 // pand 0x3d8d(%esi),%xmm4
.byte 102,15,103,228 // packuswb %xmm4,%xmm4
.byte 102,15,103,228 // packuswb %xmm4,%xmm4
.byte 102,15,103,228 // packuswb %xmm4,%xmm4
- .byte 102,15,126,225 // movd %xmm4,%ecx
- .byte 102,137,12,30 // mov %cx,(%esi,%ebx,1)
- .byte 233,112,255,255,255 // jmp 4c94 <_sk_store_a8_sse2+0x5d>
+ .byte 102,15,126,230 // movd %xmm4,%esi
+ .byte 102,137,52,58 // mov %si,(%edx,%edi,1)
+ .byte 235,164 // jmp 3bb5 <_sk_store_a8_sse2+0x50>
.byte 102,15,127,101,216 // movdqa %xmm4,-0x28(%ebp)
- .byte 138,77,216 // mov -0x28(%ebp),%cl
- .byte 136,12,30 // mov %cl,(%esi,%ebx,1)
- .byte 233,96,255,255,255 // jmp 4c94 <_sk_store_a8_sse2+0x5d>
+ .byte 138,93,216 // mov -0x28(%ebp),%bl
+ .byte 136,28,58 // mov %bl,(%edx,%edi,1)
+ .byte 235,151 // jmp 3bb5 <_sk_store_a8_sse2+0x50>
HIDDEN _sk_load_g8_sse2
.globl _sk_load_g8_sse2
@@ -54912,71 +53667,59 @@ _sk_load_g8_sse2:
.byte 83 // push %ebx
.byte 87 // push %edi
.byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 232,0,0,0,0 // call 4d42 <_sk_load_g8_sse2+0xe>
- .byte 88 // pop %eax
- .byte 15,40,101,88 // movaps 0x58(%ebp),%xmm4
- .byte 15,40,93,72 // movaps 0x48(%ebp),%xmm3
- .byte 15,40,85,56 // movaps 0x38(%ebp),%xmm2
- .byte 15,40,77,40 // movaps 0x28(%ebp),%xmm1
- .byte 139,77,12 // mov 0xc(%ebp),%ecx
- .byte 139,57 // mov (%ecx),%edi
+ .byte 131,236,12 // sub $0xc,%esp
+ .byte 232,0,0,0,0 // call 3c2c <_sk_load_g8_sse2+0xe>
+ .byte 90 // pop %edx
+ .byte 139,69,12 // mov 0xc(%ebp),%eax
+ .byte 139,77,8 // mov 0x8(%ebp),%ecx
+ .byte 139,56 // mov (%eax),%edi
.byte 139,119,4 // mov 0x4(%edi),%esi
- .byte 15,175,117,20 // imul 0x14(%ebp),%esi
+ .byte 15,175,113,4 // imul 0x4(%ecx),%esi
.byte 3,55 // add (%edi),%esi
- .byte 139,93,24 // mov 0x18(%ebp),%ebx
+ .byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
- .byte 139,125,16 // mov 0x10(%ebp),%edi
- .byte 117,103 // jne 4dd2 <_sk_load_g8_sse2+0x9e>
+ .byte 139,57 // mov (%ecx),%edi
+ .byte 117,63 // jne 3c86 <_sk_load_g8_sse2+0x68>
.byte 102,15,110,4,62 // movd (%esi,%edi,1),%xmm0
.byte 102,15,96,192 // punpcklbw %xmm0,%xmm0
.byte 102,15,97,192 // punpcklwd %xmm0,%xmm0
- .byte 102,15,219,128,190,78,0,0 // pand 0x4ebe(%eax),%xmm0
+ .byte 102,15,219,130,228,60,0,0 // pand 0x3ce4(%edx),%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,128,206,78,0,0 // mulps 0x4ece(%eax),%xmm0
- .byte 141,81,8 // lea 0x8(%ecx),%edx
- .byte 15,41,100,36,80 // movaps %xmm4,0x50(%esp)
- .byte 15,41,92,36,64 // movaps %xmm3,0x40(%esp)
- .byte 15,41,84,36,48 // movaps %xmm2,0x30(%esp)
- .byte 15,41,76,36,32 // movaps %xmm1,0x20(%esp)
- .byte 137,92,36,16 // mov %ebx,0x10(%esp)
- .byte 139,117,20 // mov 0x14(%ebp),%esi
- .byte 137,116,36,12 // mov %esi,0xc(%esp)
- .byte 137,124,36,8 // mov %edi,0x8(%esp)
- .byte 137,84,36,4 // mov %edx,0x4(%esp)
- .byte 139,85,8 // mov 0x8(%ebp),%edx
- .byte 137,20,36 // mov %edx,(%esp)
- .byte 15,40,152,222,78,0,0 // movaps 0x4ede(%eax),%xmm3
+ .byte 15,89,130,244,60,0,0 // mulps 0x3cf4(%edx),%xmm0
+ .byte 141,112,8 // lea 0x8(%eax),%esi
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 15,40,154,4,61,0,0 // movaps 0x3d04(%edx),%xmm3
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
- .byte 255,81,4 // call *0x4(%ecx)
- .byte 131,196,108 // add $0x6c,%esp
+ .byte 86 // push %esi
+ .byte 81 // push %ecx
+ .byte 255,80,4 // call *0x4(%eax)
+ .byte 131,196,28 // add $0x1c,%esp
.byte 94 // pop %esi
.byte 95 // pop %edi
.byte 91 // pop %ebx
.byte 93 // pop %ebp
.byte 195 // ret
- .byte 137,218 // mov %ebx,%edx
- .byte 128,226,3 // and $0x3,%dl
- .byte 128,250,1 // cmp $0x1,%dl
- .byte 116,53 // je 4e11 <_sk_load_g8_sse2+0xdd>
+ .byte 128,227,3 // and $0x3,%bl
+ .byte 128,251,1 // cmp $0x1,%bl
+ .byte 116,50 // je 3cc0 <_sk_load_g8_sse2+0xa2>
.byte 102,15,239,192 // pxor %xmm0,%xmm0
- .byte 128,250,2 // cmp $0x2,%dl
- .byte 116,19 // je 4df8 <_sk_load_g8_sse2+0xc4>
- .byte 128,250,3 // cmp $0x3,%dl
- .byte 117,142 // jne 4d78 <_sk_load_g8_sse2+0x44>
- .byte 15,182,84,62,2 // movzbl 0x2(%esi,%edi,1),%edx
- .byte 102,15,110,194 // movd %edx,%xmm0
+ .byte 128,251,2 // cmp $0x2,%bl
+ .byte 116,19 // je 3caa <_sk_load_g8_sse2+0x8c>
+ .byte 128,251,3 // cmp $0x3,%bl
+ .byte 117,184 // jne 3c54 <_sk_load_g8_sse2+0x36>
+ .byte 15,182,92,62,2 // movzbl 0x2(%esi,%edi,1),%ebx
+ .byte 102,15,110,195 // movd %ebx,%xmm0
.byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0
- .byte 15,183,20,62 // movzwl (%esi,%edi,1),%edx
- .byte 102,15,110,234 // movd %edx,%xmm5
- .byte 102,15,96,232 // punpcklbw %xmm0,%xmm5
- .byte 102,15,97,232 // punpcklwd %xmm0,%xmm5
- .byte 242,15,16,197 // movsd %xmm5,%xmm0
- .byte 233,103,255,255,255 // jmp 4d78 <_sk_load_g8_sse2+0x44>
- .byte 15,182,20,62 // movzbl (%esi,%edi,1),%edx
- .byte 102,15,110,194 // movd %edx,%xmm0
- .byte 233,90,255,255,255 // jmp 4d78 <_sk_load_g8_sse2+0x44>
+ .byte 15,183,52,62 // movzwl (%esi,%edi,1),%esi
+ .byte 102,15,110,206 // movd %esi,%xmm1
+ .byte 102,15,96,200 // punpcklbw %xmm0,%xmm1
+ .byte 102,15,97,200 // punpcklwd %xmm0,%xmm1
+ .byte 242,15,16,193 // movsd %xmm1,%xmm0
+ .byte 235,148 // jmp 3c54 <_sk_load_g8_sse2+0x36>
+ .byte 15,182,52,62 // movzbl (%esi,%edi,1),%esi
+ .byte 102,15,110,198 // movd %esi,%xmm0
+ .byte 235,138 // jmp 3c54 <_sk_load_g8_sse2+0x36>
HIDDEN _sk_load_g8_dst_sse2
.globl _sk_load_g8_dst_sse2
@@ -54987,65 +53730,61 @@ _sk_load_g8_dst_sse2:
.byte 83 // push %ebx
.byte 87 // push %edi
.byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 232,0,0,0,0 // call 4e2c <_sk_load_g8_dst_sse2+0xe>
+ .byte 131,236,12 // sub $0xc,%esp
+ .byte 232,0,0,0,0 // call 3cd8 <_sk_load_g8_dst_sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
+ .byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 139,56 // mov (%eax),%edi
.byte 139,119,4 // mov 0x4(%edi),%esi
- .byte 15,175,117,20 // imul 0x14(%ebp),%esi
+ .byte 15,175,113,4 // imul 0x4(%ecx),%esi
.byte 3,55 // add (%edi),%esi
- .byte 139,93,24 // mov 0x18(%ebp),%ebx
+ .byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
- .byte 139,125,16 // mov 0x10(%ebp),%edi
- .byte 117,97 // jne 4ea6 <_sk_load_g8_dst_sse2+0x88>
+ .byte 139,57 // mov (%ecx),%edi
+ .byte 117,73 // jne 3d3c <_sk_load_g8_dst_sse2+0x72>
.byte 102,15,110,36,62 // movd (%esi,%edi,1),%xmm4
.byte 102,15,96,224 // punpcklbw %xmm0,%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
- .byte 102,15,219,162,4,78,0,0 // pand 0x4e04(%edx),%xmm4
+ .byte 102,15,219,162,104,60,0,0 // pand 0x3c68(%edx),%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,162,20,78,0,0 // mulps 0x4e14(%edx),%xmm4
- .byte 141,72,8 // lea 0x8(%eax),%ecx
- .byte 15,40,170,36,78,0,0 // movaps 0x4e24(%edx),%xmm5
- .byte 15,41,108,36,80 // movaps %xmm5,0x50(%esp)
- .byte 137,92,36,16 // mov %ebx,0x10(%esp)
- .byte 139,85,20 // mov 0x14(%ebp),%edx
- .byte 137,84,36,12 // mov %edx,0xc(%esp)
- .byte 137,124,36,8 // mov %edi,0x8(%esp)
- .byte 137,76,36,4 // mov %ecx,0x4(%esp)
- .byte 139,77,8 // mov 0x8(%ebp),%ecx
- .byte 137,12,36 // mov %ecx,(%esp)
- .byte 15,41,100,36,64 // movaps %xmm4,0x40(%esp)
- .byte 15,41,100,36,48 // movaps %xmm4,0x30(%esp)
- .byte 15,41,100,36,32 // movaps %xmm4,0x20(%esp)
+ .byte 15,89,162,120,60,0,0 // mulps 0x3c78(%edx),%xmm4
+ .byte 15,41,97,48 // movaps %xmm4,0x30(%ecx)
+ .byte 15,41,97,32 // movaps %xmm4,0x20(%ecx)
+ .byte 15,41,97,16 // movaps %xmm4,0x10(%ecx)
+ .byte 15,40,162,136,60,0,0 // movaps 0x3c88(%edx),%xmm4
+ .byte 15,41,97,64 // movaps %xmm4,0x40(%ecx)
+ .byte 141,80,8 // lea 0x8(%eax),%edx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 82 // push %edx
+ .byte 81 // push %ecx
.byte 255,80,4 // call *0x4(%eax)
- .byte 131,196,108 // add $0x6c,%esp
+ .byte 131,196,28 // add $0x1c,%esp
.byte 94 // pop %esi
.byte 95 // pop %edi
.byte 91 // pop %ebx
.byte 93 // pop %ebp
.byte 195 // ret
- .byte 137,217 // mov %ebx,%ecx
- .byte 128,225,3 // and $0x3,%cl
- .byte 128,249,1 // cmp $0x1,%cl
- .byte 116,53 // je 4ee5 <_sk_load_g8_dst_sse2+0xc7>
+ .byte 128,227,3 // and $0x3,%bl
+ .byte 128,251,1 // cmp $0x1,%bl
+ .byte 116,50 // je 3d76 <_sk_load_g8_dst_sse2+0xac>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
- .byte 128,249,2 // cmp $0x2,%cl
- .byte 116,19 // je 4ecc <_sk_load_g8_dst_sse2+0xae>
- .byte 128,249,3 // cmp $0x3,%cl
- .byte 117,148 // jne 4e52 <_sk_load_g8_dst_sse2+0x34>
- .byte 15,182,76,62,2 // movzbl 0x2(%esi,%edi,1),%ecx
- .byte 102,15,110,225 // movd %ecx,%xmm4
+ .byte 128,251,2 // cmp $0x2,%bl
+ .byte 116,19 // je 3d60 <_sk_load_g8_dst_sse2+0x96>
+ .byte 128,251,3 // cmp $0x3,%bl
+ .byte 117,174 // jne 3d00 <_sk_load_g8_dst_sse2+0x36>
+ .byte 15,182,92,62,2 // movzbl 0x2(%esi,%edi,1),%ebx
+ .byte 102,15,110,227 // movd %ebx,%xmm4
.byte 102,15,112,228,69 // pshufd $0x45,%xmm4,%xmm4
- .byte 15,183,12,62 // movzwl (%esi,%edi,1),%ecx
- .byte 102,15,110,233 // movd %ecx,%xmm5
+ .byte 15,183,52,62 // movzwl (%esi,%edi,1),%esi
+ .byte 102,15,110,238 // movd %esi,%xmm5
.byte 102,15,96,232 // punpcklbw %xmm0,%xmm5
.byte 102,15,97,232 // punpcklwd %xmm0,%xmm5
.byte 242,15,16,229 // movsd %xmm5,%xmm4
- .byte 233,109,255,255,255 // jmp 4e52 <_sk_load_g8_dst_sse2+0x34>
- .byte 15,182,12,62 // movzbl (%esi,%edi,1),%ecx
- .byte 102,15,110,225 // movd %ecx,%xmm4
- .byte 233,96,255,255,255 // jmp 4e52 <_sk_load_g8_dst_sse2+0x34>
+ .byte 235,138 // jmp 3d00 <_sk_load_g8_dst_sse2+0x36>
+ .byte 15,182,52,62 // movzbl (%esi,%edi,1),%esi
+ .byte 102,15,110,230 // movd %esi,%xmm4
+ .byte 235,128 // jmp 3d00 <_sk_load_g8_dst_sse2+0x36>
HIDDEN _sk_gather_g8_sse2
.globl _sk_gather_g8_sse2
@@ -55053,10 +53792,8 @@ FUNCTION(_sk_gather_g8_sse2)
_sk_gather_g8_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
.byte 87 // push %edi
.byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,8 // mov (%eax),%ecx
.byte 139,17 // mov (%ecx),%edx
@@ -55084,44 +53821,28 @@ _sk_gather_g8_sse2:
.byte 102,15,126,206 // movd %xmm1,%esi
.byte 15,182,12,10 // movzbl (%edx,%ecx,1),%ecx
.byte 15,182,20,50 // movzbl (%edx,%esi,1),%edx
- .byte 232,0,0,0,0 // call 4f6c <_sk_gather_g8_sse2+0x7a>
- .byte 94 // pop %esi
.byte 193,226,8 // shl $0x8,%edx
.byte 9,202 // or %ecx,%edx
.byte 102,15,196,194,0 // pinsrw $0x0,%edx,%xmm0
- .byte 139,85,16 // mov 0x10(%ebp),%edx
+ .byte 232,0,0,0,0 // call 3e00 <_sk_gather_g8_sse2+0x80>
+ .byte 89 // pop %ecx
.byte 102,15,196,199,1 // pinsrw $0x1,%edi,%xmm0
- .byte 139,125,20 // mov 0x14(%ebp),%edi
- .byte 15,40,77,40 // movaps 0x28(%ebp),%xmm1
- .byte 15,40,85,56 // movaps 0x38(%ebp),%xmm2
- .byte 15,40,93,72 // movaps 0x48(%ebp),%xmm3
- .byte 15,40,101,88 // movaps 0x58(%ebp),%xmm4
- .byte 102,15,239,237 // pxor %xmm5,%xmm5
- .byte 102,15,96,197 // punpcklbw %xmm5,%xmm0
- .byte 102,15,97,197 // punpcklwd %xmm5,%xmm0
+ .byte 102,15,239,201 // pxor %xmm1,%xmm1
+ .byte 102,15,96,193 // punpcklbw %xmm1,%xmm0
+ .byte 102,15,97,193 // punpcklwd %xmm1,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,134,244,76,0,0 // mulps 0x4cf4(%esi),%xmm0
- .byte 139,93,24 // mov 0x18(%ebp),%ebx
- .byte 137,193 // mov %eax,%ecx
- .byte 141,65,8 // lea 0x8(%ecx),%eax
- .byte 15,41,100,36,80 // movaps %xmm4,0x50(%esp)
- .byte 15,41,92,36,64 // movaps %xmm3,0x40(%esp)
- .byte 15,41,84,36,48 // movaps %xmm2,0x30(%esp)
- .byte 15,41,76,36,32 // movaps %xmm1,0x20(%esp)
- .byte 137,92,36,16 // mov %ebx,0x10(%esp)
- .byte 137,124,36,12 // mov %edi,0xc(%esp)
- .byte 137,84,36,8 // mov %edx,0x8(%esp)
- .byte 137,68,36,4 // mov %eax,0x4(%esp)
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 137,4,36 // mov %eax,(%esp)
- .byte 15,40,158,4,77,0,0 // movaps 0x4d04(%esi),%xmm3
+ .byte 15,89,129,112,59,0,0 // mulps 0x3b70(%ecx),%xmm0
+ .byte 141,80,8 // lea 0x8(%eax),%edx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 15,40,153,128,59,0,0 // movaps 0x3b80(%ecx),%xmm3
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
- .byte 255,81,4 // call *0x4(%ecx)
- .byte 131,196,108 // add $0x6c,%esp
+ .byte 82 // push %edx
+ .byte 255,117,8 // pushl 0x8(%ebp)
+ .byte 255,80,4 // call *0x4(%eax)
+ .byte 131,196,16 // add $0x10,%esp
.byte 94 // pop %esi
.byte 95 // pop %edi
- .byte 91 // pop %ebx
.byte 93 // pop %ebp
.byte 195 // ret
@@ -55134,75 +53855,63 @@ _sk_load_565_sse2:
.byte 83 // push %ebx
.byte 87 // push %edi
.byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 232,0,0,0,0 // call 5000 <_sk_load_565_sse2+0xe>
- .byte 88 // pop %eax
- .byte 15,40,117,88 // movaps 0x58(%ebp),%xmm6
- .byte 15,40,109,72 // movaps 0x48(%ebp),%xmm5
- .byte 15,40,101,56 // movaps 0x38(%ebp),%xmm4
- .byte 15,40,93,40 // movaps 0x28(%ebp),%xmm3
- .byte 139,77,12 // mov 0xc(%ebp),%ecx
- .byte 139,57 // mov (%ecx),%edi
+ .byte 131,236,12 // sub $0xc,%esp
+ .byte 232,0,0,0,0 // call 3e4b <_sk_load_565_sse2+0xe>
+ .byte 90 // pop %edx
+ .byte 139,69,12 // mov 0xc(%ebp),%eax
+ .byte 139,77,8 // mov 0x8(%ebp),%ecx
+ .byte 139,56 // mov (%eax),%edi
.byte 139,119,4 // mov 0x4(%edi),%esi
- .byte 15,175,117,20 // imul 0x14(%ebp),%esi
+ .byte 15,175,113,4 // imul 0x4(%ecx),%esi
.byte 1,246 // add %esi,%esi
.byte 3,55 // add (%edi),%esi
- .byte 139,93,24 // mov 0x18(%ebp),%ebx
+ .byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
- .byte 139,125,16 // mov 0x10(%ebp),%edi
- .byte 15,133,137,0,0,0 // jne 50b8 <_sk_load_565_sse2+0xc6>
+ .byte 139,57 // mov (%ecx),%edi
+ .byte 117,97 // jne 3ec9 <_sk_load_565_sse2+0x8c>
.byte 243,15,126,20,126 // movq (%esi,%edi,2),%xmm2
.byte 102,15,97,208 // punpcklwd %xmm0,%xmm2
- .byte 102,15,111,128,128,76,0,0 // movdqa 0x4c80(%eax),%xmm0
+ .byte 102,15,111,130,69,59,0,0 // movdqa 0x3b45(%edx),%xmm0
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,128,144,76,0,0 // mulps 0x4c90(%eax),%xmm0
- .byte 102,15,111,136,160,76,0,0 // movdqa 0x4ca0(%eax),%xmm1
+ .byte 15,89,130,85,59,0,0 // mulps 0x3b55(%edx),%xmm0
+ .byte 102,15,111,138,101,59,0,0 // movdqa 0x3b65(%edx),%xmm1
.byte 102,15,219,202 // pand %xmm2,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,136,176,76,0,0 // mulps 0x4cb0(%eax),%xmm1
- .byte 102,15,219,144,192,76,0,0 // pand 0x4cc0(%eax),%xmm2
+ .byte 15,89,138,117,59,0,0 // mulps 0x3b75(%edx),%xmm1
+ .byte 102,15,219,146,133,59,0,0 // pand 0x3b85(%edx),%xmm2
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,144,208,76,0,0 // mulps 0x4cd0(%eax),%xmm2
- .byte 141,81,8 // lea 0x8(%ecx),%edx
- .byte 15,41,116,36,80 // movaps %xmm6,0x50(%esp)
- .byte 15,41,108,36,64 // movaps %xmm5,0x40(%esp)
- .byte 15,41,100,36,48 // movaps %xmm4,0x30(%esp)
- .byte 15,41,92,36,32 // movaps %xmm3,0x20(%esp)
- .byte 137,92,36,16 // mov %ebx,0x10(%esp)
- .byte 139,117,20 // mov 0x14(%ebp),%esi
- .byte 137,116,36,12 // mov %esi,0xc(%esp)
- .byte 137,124,36,8 // mov %edi,0x8(%esp)
- .byte 137,84,36,4 // mov %edx,0x4(%esp)
- .byte 139,85,8 // mov 0x8(%ebp),%edx
- .byte 137,20,36 // mov %edx,(%esp)
- .byte 15,40,152,224,76,0,0 // movaps 0x4ce0(%eax),%xmm3
- .byte 255,81,4 // call *0x4(%ecx)
- .byte 131,196,108 // add $0x6c,%esp
+ .byte 15,89,146,149,59,0,0 // mulps 0x3b95(%edx),%xmm2
+ .byte 141,112,8 // lea 0x8(%eax),%esi
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 15,40,154,165,59,0,0 // movaps 0x3ba5(%edx),%xmm3
+ .byte 86 // push %esi
+ .byte 81 // push %ecx
+ .byte 255,80,4 // call *0x4(%eax)
+ .byte 131,196,28 // add $0x1c,%esp
.byte 94 // pop %esi
.byte 95 // pop %edi
.byte 91 // pop %ebx
.byte 93 // pop %ebp
.byte 195 // ret
- .byte 137,218 // mov %ebx,%edx
- .byte 128,226,3 // and $0x3,%dl
- .byte 128,250,1 // cmp $0x1,%dl
- .byte 116,50 // je 50f4 <_sk_load_565_sse2+0x102>
+ .byte 128,227,3 // and $0x3,%bl
+ .byte 128,251,1 // cmp $0x1,%bl
+ .byte 116,46 // je 3eff <_sk_load_565_sse2+0xc2>
.byte 102,15,239,210 // pxor %xmm2,%xmm2
- .byte 128,250,2 // cmp $0x2,%dl
- .byte 116,23 // je 50e2 <_sk_load_565_sse2+0xf0>
- .byte 128,250,3 // cmp $0x3,%dl
- .byte 15,133,100,255,255,255 // jne 5038 <_sk_load_565_sse2+0x46>
- .byte 15,183,84,126,4 // movzwl 0x4(%esi,%edi,2),%edx
- .byte 102,15,110,194 // movd %edx,%xmm0
+ .byte 128,251,2 // cmp $0x2,%bl
+ .byte 116,19 // je 3eed <_sk_load_565_sse2+0xb0>
+ .byte 128,251,3 // cmp $0x3,%bl
+ .byte 117,146 // jne 3e71 <_sk_load_565_sse2+0x34>
+ .byte 15,183,92,126,4 // movzwl 0x4(%esi,%edi,2),%ebx
+ .byte 102,15,110,195 // movd %ebx,%xmm0
.byte 102,15,112,208,69 // pshufd $0x45,%xmm0,%xmm2
.byte 102,15,110,4,126 // movd (%esi,%edi,2),%xmm0
.byte 102,15,97,192 // punpcklwd %xmm0,%xmm0
.byte 242,15,16,208 // movsd %xmm0,%xmm2
- .byte 233,68,255,255,255 // jmp 5038 <_sk_load_565_sse2+0x46>
- .byte 15,183,20,126 // movzwl (%esi,%edi,2),%edx
- .byte 102,15,110,210 // movd %edx,%xmm2
- .byte 233,55,255,255,255 // jmp 5038 <_sk_load_565_sse2+0x46>
+ .byte 233,114,255,255,255 // jmp 3e71 <_sk_load_565_sse2+0x34>
+ .byte 15,183,52,126 // movzwl (%esi,%edi,2),%esi
+ .byte 102,15,110,214 // movd %esi,%xmm2
+ .byte 233,101,255,255,255 // jmp 3e71 <_sk_load_565_sse2+0x34>
HIDDEN _sk_load_565_dst_sse2
.globl _sk_load_565_dst_sse2
@@ -55213,71 +53922,67 @@ _sk_load_565_dst_sse2:
.byte 83 // push %ebx
.byte 87 // push %edi
.byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 232,0,0,0,0 // call 510f <_sk_load_565_dst_sse2+0xe>
+ .byte 131,236,12 // sub $0xc,%esp
+ .byte 232,0,0,0,0 // call 3f1a <_sk_load_565_dst_sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
+ .byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 139,56 // mov (%eax),%edi
.byte 139,119,4 // mov 0x4(%edi),%esi
- .byte 15,175,117,20 // imul 0x14(%ebp),%esi
+ .byte 15,175,113,4 // imul 0x4(%ecx),%esi
.byte 1,246 // add %esi,%esi
.byte 3,55 // add (%edi),%esi
- .byte 139,93,24 // mov 0x18(%ebp),%ebx
+ .byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
- .byte 139,125,16 // mov 0x10(%ebp),%edi
- .byte 15,133,137,0,0,0 // jne 51b7 <_sk_load_565_dst_sse2+0xb6>
+ .byte 139,57 // mov (%ecx),%edi
+ .byte 117,113 // jne 3fa8 <_sk_load_565_dst_sse2+0x9c>
.byte 243,15,126,36,126 // movq (%esi,%edi,2),%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
- .byte 102,15,111,170,225,75,0,0 // movdqa 0x4be1(%edx),%xmm5
+ .byte 102,15,111,170,230,58,0,0 // movdqa 0x3ae6(%edx),%xmm5
.byte 102,15,219,236 // pand %xmm4,%xmm5
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
- .byte 15,89,170,241,75,0,0 // mulps 0x4bf1(%edx),%xmm5
- .byte 102,15,111,178,1,76,0,0 // movdqa 0x4c01(%edx),%xmm6
- .byte 102,15,219,244 // pand %xmm4,%xmm6
- .byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
- .byte 15,89,178,17,76,0,0 // mulps 0x4c11(%edx),%xmm6
- .byte 102,15,219,162,33,76,0,0 // pand 0x4c21(%edx),%xmm4
+ .byte 15,89,170,246,58,0,0 // mulps 0x3af6(%edx),%xmm5
+ .byte 15,41,105,16 // movaps %xmm5,0x10(%ecx)
+ .byte 102,15,111,170,6,59,0,0 // movdqa 0x3b06(%edx),%xmm5
+ .byte 102,15,219,236 // pand %xmm4,%xmm5
+ .byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
+ .byte 15,89,170,22,59,0,0 // mulps 0x3b16(%edx),%xmm5
+ .byte 15,41,105,32 // movaps %xmm5,0x20(%ecx)
+ .byte 102,15,219,162,38,59,0,0 // pand 0x3b26(%edx),%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,162,49,76,0,0 // mulps 0x4c31(%edx),%xmm4
- .byte 141,72,8 // lea 0x8(%eax),%ecx
- .byte 15,40,186,65,76,0,0 // movaps 0x4c41(%edx),%xmm7
- .byte 15,41,124,36,80 // movaps %xmm7,0x50(%esp)
- .byte 137,92,36,16 // mov %ebx,0x10(%esp)
- .byte 139,85,20 // mov 0x14(%ebp),%edx
- .byte 137,84,36,12 // mov %edx,0xc(%esp)
- .byte 137,124,36,8 // mov %edi,0x8(%esp)
- .byte 137,76,36,4 // mov %ecx,0x4(%esp)
- .byte 139,77,8 // mov 0x8(%ebp),%ecx
- .byte 137,12,36 // mov %ecx,(%esp)
- .byte 15,41,100,36,64 // movaps %xmm4,0x40(%esp)
- .byte 15,41,116,36,48 // movaps %xmm6,0x30(%esp)
- .byte 15,41,108,36,32 // movaps %xmm5,0x20(%esp)
+ .byte 15,89,162,54,59,0,0 // mulps 0x3b36(%edx),%xmm4
+ .byte 15,41,97,48 // movaps %xmm4,0x30(%ecx)
+ .byte 15,40,162,70,59,0,0 // movaps 0x3b46(%edx),%xmm4
+ .byte 15,41,97,64 // movaps %xmm4,0x40(%ecx)
+ .byte 141,80,8 // lea 0x8(%eax),%edx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 82 // push %edx
+ .byte 81 // push %ecx
.byte 255,80,4 // call *0x4(%eax)
- .byte 131,196,108 // add $0x6c,%esp
+ .byte 131,196,28 // add $0x1c,%esp
.byte 94 // pop %esi
.byte 95 // pop %edi
.byte 91 // pop %ebx
.byte 93 // pop %ebp
.byte 195 // ret
- .byte 137,217 // mov %ebx,%ecx
- .byte 128,225,3 // and $0x3,%cl
- .byte 128,249,1 // cmp $0x1,%cl
- .byte 116,50 // je 51f3 <_sk_load_565_dst_sse2+0xf2>
+ .byte 128,227,3 // and $0x3,%bl
+ .byte 128,251,1 // cmp $0x1,%bl
+ .byte 116,46 // je 3fde <_sk_load_565_dst_sse2+0xd2>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
- .byte 128,249,2 // cmp $0x2,%cl
- .byte 116,23 // je 51e1 <_sk_load_565_dst_sse2+0xe0>
- .byte 128,249,3 // cmp $0x3,%cl
- .byte 15,133,100,255,255,255 // jne 5137 <_sk_load_565_dst_sse2+0x36>
- .byte 15,183,76,126,4 // movzwl 0x4(%esi,%edi,2),%ecx
- .byte 102,15,110,225 // movd %ecx,%xmm4
+ .byte 128,251,2 // cmp $0x2,%bl
+ .byte 116,19 // je 3fcc <_sk_load_565_dst_sse2+0xc0>
+ .byte 128,251,3 // cmp $0x3,%bl
+ .byte 117,130 // jne 3f40 <_sk_load_565_dst_sse2+0x34>
+ .byte 15,183,92,126,4 // movzwl 0x4(%esi,%edi,2),%ebx
+ .byte 102,15,110,227 // movd %ebx,%xmm4
.byte 102,15,112,228,69 // pshufd $0x45,%xmm4,%xmm4
.byte 102,15,110,44,126 // movd (%esi,%edi,2),%xmm5
.byte 102,15,97,232 // punpcklwd %xmm0,%xmm5
.byte 242,15,16,229 // movsd %xmm5,%xmm4
- .byte 233,68,255,255,255 // jmp 5137 <_sk_load_565_dst_sse2+0x36>
- .byte 15,183,12,126 // movzwl (%esi,%edi,2),%ecx
- .byte 102,15,110,225 // movd %ecx,%xmm4
- .byte 233,55,255,255,255 // jmp 5137 <_sk_load_565_dst_sse2+0x36>
+ .byte 233,98,255,255,255 // jmp 3f40 <_sk_load_565_dst_sse2+0x34>
+ .byte 15,183,52,126 // movzwl (%esi,%edi,2),%esi
+ .byte 102,15,110,230 // movd %esi,%xmm4
+ .byte 233,85,255,255,255 // jmp 3f40 <_sk_load_565_dst_sse2+0x34>
HIDDEN _sk_gather_565_sse2
.globl _sk_gather_565_sse2
@@ -55285,17 +53990,12 @@ FUNCTION(_sk_gather_565_sse2)
_sk_gather_565_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 232,0,0,0,0 // call 520e <_sk_gather_565_sse2+0xe>
- .byte 88 // pop %eax
- .byte 139,85,12 // mov 0xc(%ebp),%edx
- .byte 139,50 // mov (%edx),%esi
- .byte 139,62 // mov (%esi),%edi
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 139,69,12 // mov 0xc(%ebp),%eax
+ .byte 139,8 // mov (%eax),%ecx
+ .byte 139,17 // mov (%ecx),%edx
.byte 243,15,91,201 // cvttps2dq %xmm1,%xmm1
- .byte 102,15,110,86,4 // movd 0x4(%esi),%xmm2
+ .byte 102,15,110,81,4 // movd 0x4(%ecx),%xmm2
.byte 102,15,112,210,0 // pshufd $0x0,%xmm2,%xmm2
.byte 102,15,112,217,245 // pshufd $0xf5,%xmm1,%xmm3
.byte 102,15,244,218 // pmuludq %xmm2,%xmm3
@@ -55305,56 +54005,41 @@ _sk_gather_565_sse2:
.byte 102,15,98,203 // punpckldq %xmm3,%xmm1
.byte 243,15,91,192 // cvttps2dq %xmm0,%xmm0
.byte 102,15,254,193 // paddd %xmm1,%xmm0
- .byte 102,15,126,198 // movd %xmm0,%esi
+ .byte 102,15,126,193 // movd %xmm0,%ecx
.byte 102,15,112,200,229 // pshufd $0xe5,%xmm0,%xmm1
- .byte 102,15,196,20,119,0 // pinsrw $0x0,(%edi,%esi,2),%xmm2
- .byte 102,15,126,206 // movd %xmm1,%esi
+ .byte 102,15,196,20,74,0 // pinsrw $0x0,(%edx,%ecx,2),%xmm2
+ .byte 102,15,126,201 // movd %xmm1,%ecx
.byte 102,15,112,200,78 // pshufd $0x4e,%xmm0,%xmm1
- .byte 102,15,196,20,119,1 // pinsrw $0x1,(%edi,%esi,2),%xmm2
- .byte 102,15,126,206 // movd %xmm1,%esi
+ .byte 102,15,196,20,74,1 // pinsrw $0x1,(%edx,%ecx,2),%xmm2
+ .byte 102,15,126,201 // movd %xmm1,%ecx
.byte 102,15,112,192,231 // pshufd $0xe7,%xmm0,%xmm0
- .byte 15,183,52,119 // movzwl (%edi,%esi,2),%esi
- .byte 102,15,196,214,2 // pinsrw $0x2,%esi,%xmm2
- .byte 102,15,126,198 // movd %xmm0,%esi
- .byte 15,183,52,119 // movzwl (%edi,%esi,2),%esi
- .byte 139,125,16 // mov 0x10(%ebp),%edi
- .byte 102,15,196,214,3 // pinsrw $0x3,%esi,%xmm2
- .byte 139,117,20 // mov 0x14(%ebp),%esi
- .byte 15,40,93,40 // movaps 0x28(%ebp),%xmm3
- .byte 15,40,101,56 // movaps 0x38(%ebp),%xmm4
- .byte 15,40,109,72 // movaps 0x48(%ebp),%xmm5
- .byte 15,40,117,88 // movaps 0x58(%ebp),%xmm6
+ .byte 15,183,12,74 // movzwl (%edx,%ecx,2),%ecx
+ .byte 102,15,196,209,2 // pinsrw $0x2,%ecx,%xmm2
+ .byte 102,15,126,193 // movd %xmm0,%ecx
+ .byte 15,183,12,74 // movzwl (%edx,%ecx,2),%ecx
+ .byte 232,0,0,0,0 // call 4066 <_sk_gather_565_sse2+0x7b>
+ .byte 90 // pop %edx
+ .byte 102,15,196,209,3 // pinsrw $0x3,%ecx,%xmm2
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 102,15,97,208 // punpcklwd %xmm0,%xmm2
- .byte 102,15,111,128,82,75,0,0 // movdqa 0x4b52(%eax),%xmm0
+ .byte 102,15,111,130,10,58,0,0 // movdqa 0x3a0a(%edx),%xmm0
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,128,98,75,0,0 // mulps 0x4b62(%eax),%xmm0
- .byte 102,15,111,136,114,75,0,0 // movdqa 0x4b72(%eax),%xmm1
+ .byte 15,89,130,26,58,0,0 // mulps 0x3a1a(%edx),%xmm0
+ .byte 102,15,111,138,42,58,0,0 // movdqa 0x3a2a(%edx),%xmm1
.byte 102,15,219,202 // pand %xmm2,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,136,130,75,0,0 // mulps 0x4b82(%eax),%xmm1
- .byte 102,15,219,144,146,75,0,0 // pand 0x4b92(%eax),%xmm2
+ .byte 15,89,138,58,58,0,0 // mulps 0x3a3a(%edx),%xmm1
+ .byte 102,15,219,146,74,58,0,0 // pand 0x3a4a(%edx),%xmm2
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,144,162,75,0,0 // mulps 0x4ba2(%eax),%xmm2
- .byte 139,93,24 // mov 0x18(%ebp),%ebx
- .byte 141,74,8 // lea 0x8(%edx),%ecx
- .byte 15,41,116,36,80 // movaps %xmm6,0x50(%esp)
- .byte 15,41,108,36,64 // movaps %xmm5,0x40(%esp)
- .byte 15,41,100,36,48 // movaps %xmm4,0x30(%esp)
- .byte 15,41,92,36,32 // movaps %xmm3,0x20(%esp)
- .byte 137,92,36,16 // mov %ebx,0x10(%esp)
- .byte 137,116,36,12 // mov %esi,0xc(%esp)
- .byte 137,124,36,8 // mov %edi,0x8(%esp)
- .byte 137,76,36,4 // mov %ecx,0x4(%esp)
- .byte 139,77,8 // mov 0x8(%ebp),%ecx
- .byte 137,12,36 // mov %ecx,(%esp)
- .byte 15,40,152,178,75,0,0 // movaps 0x4bb2(%eax),%xmm3
- .byte 255,82,4 // call *0x4(%edx)
- .byte 131,196,108 // add $0x6c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 15,89,146,90,58,0,0 // mulps 0x3a5a(%edx),%xmm2
+ .byte 141,72,8 // lea 0x8(%eax),%ecx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 15,40,154,106,58,0,0 // movaps 0x3a6a(%edx),%xmm3
+ .byte 81 // push %ecx
+ .byte 255,117,8 // pushl 0x8(%ebp)
+ .byte 255,80,4 // call *0x4(%eax)
+ .byte 131,196,24 // add $0x18,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -55367,65 +54052,49 @@ _sk_store_565_sse2:
.byte 83 // push %ebx
.byte 87 // push %edi
.byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 232,0,0,0,0 // call 5330 <_sk_store_565_sse2+0xe>
- .byte 88 // pop %eax
- .byte 15,40,160,160,74,0,0 // movaps 0x4aa0(%eax),%xmm4
- .byte 15,40,232 // movaps %xmm0,%xmm5
- .byte 15,89,236 // mulps %xmm4,%xmm5
- .byte 102,15,91,237 // cvtps2dq %xmm5,%xmm5
- .byte 102,15,114,245,11 // pslld $0xb,%xmm5
- .byte 15,40,176,176,74,0,0 // movaps 0x4ab0(%eax),%xmm6
- .byte 15,89,241 // mulps %xmm1,%xmm6
- .byte 102,15,91,246 // cvtps2dq %xmm6,%xmm6
- .byte 102,15,114,246,5 // pslld $0x5,%xmm6
- .byte 102,15,235,245 // por %xmm5,%xmm6
- .byte 139,85,24 // mov 0x18(%ebp),%edx
- .byte 139,125,20 // mov 0x14(%ebp),%edi
+ .byte 131,236,12 // sub $0xc,%esp
+ .byte 232,0,0,0,0 // call 40d9 <_sk_store_565_sse2+0xe>
+ .byte 95 // pop %edi
.byte 139,69,12 // mov 0xc(%ebp),%eax
+ .byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 139,48 // mov (%eax),%esi
- .byte 139,94,4 // mov 0x4(%esi),%ebx
- .byte 15,175,223 // imul %edi,%ebx
- .byte 1,219 // add %ebx,%ebx
- .byte 3,30 // add (%esi),%ebx
- .byte 139,117,16 // mov 0x10(%ebp),%esi
+ .byte 139,86,4 // mov 0x4(%esi),%edx
+ .byte 15,175,81,4 // imul 0x4(%ecx),%edx
+ .byte 1,210 // add %edx,%edx
+ .byte 3,22 // add (%esi),%edx
+ .byte 139,49 // mov (%ecx),%esi
+ .byte 15,40,167,7,58,0,0 // movaps 0x3a07(%edi),%xmm4
+ .byte 15,40,175,23,58,0,0 // movaps 0x3a17(%edi),%xmm5
+ .byte 139,89,8 // mov 0x8(%ecx),%ebx
+ .byte 15,40,240 // movaps %xmm0,%xmm6
+ .byte 15,89,244 // mulps %xmm4,%xmm6
+ .byte 102,15,91,246 // cvtps2dq %xmm6,%xmm6
+ .byte 102,15,114,246,11 // pslld $0xb,%xmm6
+ .byte 15,89,233 // mulps %xmm1,%xmm5
+ .byte 102,15,91,237 // cvtps2dq %xmm5,%xmm5
+ .byte 102,15,114,245,5 // pslld $0x5,%xmm5
+ .byte 102,15,235,238 // por %xmm6,%xmm5
.byte 15,89,226 // mulps %xmm2,%xmm4
.byte 102,15,91,228 // cvtps2dq %xmm4,%xmm4
- .byte 102,15,86,230 // orpd %xmm6,%xmm4
+ .byte 102,15,86,229 // orpd %xmm5,%xmm4
.byte 102,15,114,244,16 // pslld $0x10,%xmm4
.byte 102,15,114,228,16 // psrad $0x10,%xmm4
.byte 102,15,107,228 // packssdw %xmm4,%xmm4
.byte 102,15,126,101,232 // movd %xmm4,-0x18(%ebp)
.byte 102,15,112,236,229 // pshufd $0xe5,%xmm4,%xmm5
.byte 102,15,126,109,236 // movd %xmm5,-0x14(%ebp)
- .byte 133,210 // test %edx,%edx
- .byte 15,40,125,56 // movaps 0x38(%ebp),%xmm7
- .byte 15,40,117,40 // movaps 0x28(%ebp),%xmm6
- .byte 117,90 // jne 5404 <_sk_store_565_sse2+0xe2>
- .byte 137,208 // mov %edx,%eax
- .byte 137,250 // mov %edi,%edx
+ .byte 133,219 // test %ebx,%ebx
+ .byte 117,34 // jne 416d <_sk_store_565_sse2+0xa2>
.byte 102,15,126,231 // movd %xmm4,%edi
- .byte 102,15,126,233 // movd %xmm5,%ecx
- .byte 137,60,115 // mov %edi,(%ebx,%esi,2)
- .byte 137,215 // mov %edx,%edi
- .byte 137,194 // mov %eax,%edx
- .byte 139,69,12 // mov 0xc(%ebp),%eax
- .byte 137,76,115,4 // mov %ecx,0x4(%ebx,%esi,2)
- .byte 141,72,8 // lea 0x8(%eax),%ecx
- .byte 15,40,101,88 // movaps 0x58(%ebp),%xmm4
- .byte 15,41,100,36,80 // movaps %xmm4,0x50(%esp)
- .byte 15,40,101,72 // movaps 0x48(%ebp),%xmm4
- .byte 15,41,100,36,64 // movaps %xmm4,0x40(%esp)
- .byte 15,41,124,36,48 // movaps %xmm7,0x30(%esp)
- .byte 15,41,116,36,32 // movaps %xmm6,0x20(%esp)
- .byte 137,84,36,16 // mov %edx,0x10(%esp)
- .byte 137,124,36,12 // mov %edi,0xc(%esp)
- .byte 137,116,36,8 // mov %esi,0x8(%esp)
- .byte 137,76,36,4 // mov %ecx,0x4(%esp)
- .byte 139,77,8 // mov 0x8(%ebp),%ecx
- .byte 137,12,36 // mov %ecx,(%esp)
+ .byte 102,15,126,235 // movd %xmm5,%ebx
+ .byte 137,60,114 // mov %edi,(%edx,%esi,2)
+ .byte 137,92,114,4 // mov %ebx,0x4(%edx,%esi,2)
+ .byte 141,80,8 // lea 0x8(%eax),%edx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 82 // push %edx
+ .byte 81 // push %ecx
.byte 255,80,4 // call *0x4(%eax)
- .byte 131,196,108 // add $0x6c,%esp
+ .byte 131,196,28 // add $0x1c,%esp
.byte 94 // pop %esi
.byte 95 // pop %edi
.byte 91 // pop %ebx
@@ -55433,27 +54102,22 @@ _sk_store_565_sse2:
.byte 195 // ret
.byte 243,15,126,101,232 // movq -0x18(%ebp),%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
- .byte 137,209 // mov %edx,%ecx
- .byte 128,225,3 // and $0x3,%cl
- .byte 128,249,1 // cmp $0x1,%cl
- .byte 116,41 // je 5440 <_sk_store_565_sse2+0x11e>
- .byte 128,249,2 // cmp $0x2,%cl
- .byte 116,19 // je 542f <_sk_store_565_sse2+0x10d>
- .byte 128,249,3 // cmp $0x3,%cl
- .byte 117,163 // jne 53c4 <_sk_store_565_sse2+0xa2>
- .byte 137,249 // mov %edi,%ecx
+ .byte 128,227,3 // and $0x3,%bl
+ .byte 128,251,1 // cmp $0x1,%bl
+ .byte 116,37 // je 41a3 <_sk_store_565_sse2+0xd8>
+ .byte 128,251,2 // cmp $0x2,%bl
+ .byte 116,15 // je 4192 <_sk_store_565_sse2+0xc7>
+ .byte 128,251,3 // cmp $0x3,%bl
+ .byte 117,210 // jne 415a <_sk_store_565_sse2+0x8f>
.byte 102,15,197,252,4 // pextrw $0x4,%xmm4,%edi
- .byte 102,137,124,115,4 // mov %di,0x4(%ebx,%esi,2)
- .byte 137,207 // mov %ecx,%edi
+ .byte 102,137,124,114,4 // mov %di,0x4(%edx,%esi,2)
.byte 102,15,112,228,212 // pshufd $0xd4,%xmm4,%xmm4
.byte 242,15,112,228,232 // pshuflw $0xe8,%xmm4,%xmm4
- .byte 102,15,126,36,115 // movd %xmm4,(%ebx,%esi,2)
- .byte 235,132 // jmp 53c4 <_sk_store_565_sse2+0xa2>
- .byte 137,249 // mov %edi,%ecx
+ .byte 102,15,126,36,114 // movd %xmm4,(%edx,%esi,2)
+ .byte 235,183 // jmp 415a <_sk_store_565_sse2+0x8f>
.byte 102,15,126,231 // movd %xmm4,%edi
- .byte 102,137,60,115 // mov %di,(%ebx,%esi,2)
- .byte 137,207 // mov %ecx,%edi
- .byte 233,115,255,255,255 // jmp 53c4 <_sk_store_565_sse2+0xa2>
+ .byte 102,137,60,114 // mov %di,(%edx,%esi,2)
+ .byte 235,173 // jmp 415a <_sk_store_565_sse2+0x8f>
HIDDEN _sk_load_4444_sse2
.globl _sk_load_4444_sse2
@@ -55464,78 +54128,66 @@ _sk_load_4444_sse2:
.byte 83 // push %ebx
.byte 87 // push %edi
.byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 232,0,0,0,0 // call 545f <_sk_load_4444_sse2+0xe>
+ .byte 131,236,12 // sub $0xc,%esp
+ .byte 232,0,0,0,0 // call 41bb <_sk_load_4444_sse2+0xe>
.byte 90 // pop %edx
- .byte 15,40,125,88 // movaps 0x58(%ebp),%xmm7
- .byte 15,40,117,72 // movaps 0x48(%ebp),%xmm6
- .byte 15,40,109,56 // movaps 0x38(%ebp),%xmm5
- .byte 15,40,101,40 // movaps 0x28(%ebp),%xmm4
.byte 139,69,12 // mov 0xc(%ebp),%eax
+ .byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 139,56 // mov (%eax),%edi
.byte 139,119,4 // mov 0x4(%edi),%esi
- .byte 15,175,117,20 // imul 0x14(%ebp),%esi
+ .byte 15,175,113,4 // imul 0x4(%ecx),%esi
.byte 1,246 // add %esi,%esi
.byte 3,55 // add (%edi),%esi
- .byte 139,93,24 // mov 0x18(%ebp),%ebx
+ .byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
- .byte 139,125,16 // mov 0x10(%ebp),%edi
- .byte 15,133,152,0,0,0 // jne 5526 <_sk_load_4444_sse2+0xd5>
+ .byte 139,57 // mov (%ecx),%edi
+ .byte 117,112 // jne 4248 <_sk_load_4444_sse2+0x9b>
.byte 243,15,126,28,126 // movq (%esi,%edi,2),%xmm3
.byte 102,15,97,216 // punpcklwd %xmm0,%xmm3
- .byte 102,15,111,130,145,73,0,0 // movdqa 0x4991(%edx),%xmm0
+ .byte 102,15,111,130,69,57,0,0 // movdqa 0x3945(%edx),%xmm0
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,130,161,73,0,0 // mulps 0x49a1(%edx),%xmm0
- .byte 102,15,111,138,177,73,0,0 // movdqa 0x49b1(%edx),%xmm1
+ .byte 15,89,130,85,57,0,0 // mulps 0x3955(%edx),%xmm0
+ .byte 102,15,111,138,101,57,0,0 // movdqa 0x3965(%edx),%xmm1
.byte 102,15,219,203 // pand %xmm3,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,138,193,73,0,0 // mulps 0x49c1(%edx),%xmm1
- .byte 102,15,111,146,209,73,0,0 // movdqa 0x49d1(%edx),%xmm2
+ .byte 15,89,138,117,57,0,0 // mulps 0x3975(%edx),%xmm1
+ .byte 102,15,111,146,133,57,0,0 // movdqa 0x3985(%edx),%xmm2
.byte 102,15,219,211 // pand %xmm3,%xmm2
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,146,225,73,0,0 // mulps 0x49e1(%edx),%xmm2
- .byte 102,15,219,154,241,73,0,0 // pand 0x49f1(%edx),%xmm3
+ .byte 15,89,146,149,57,0,0 // mulps 0x3995(%edx),%xmm2
+ .byte 102,15,219,154,165,57,0,0 // pand 0x39a5(%edx),%xmm3
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,154,1,74,0,0 // mulps 0x4a01(%edx),%xmm3
- .byte 141,72,8 // lea 0x8(%eax),%ecx
- .byte 15,41,124,36,80 // movaps %xmm7,0x50(%esp)
- .byte 15,41,116,36,64 // movaps %xmm6,0x40(%esp)
- .byte 15,41,108,36,48 // movaps %xmm5,0x30(%esp)
- .byte 15,41,100,36,32 // movaps %xmm4,0x20(%esp)
- .byte 137,92,36,16 // mov %ebx,0x10(%esp)
- .byte 139,85,20 // mov 0x14(%ebp),%edx
- .byte 137,84,36,12 // mov %edx,0xc(%esp)
- .byte 137,124,36,8 // mov %edi,0x8(%esp)
- .byte 137,76,36,4 // mov %ecx,0x4(%esp)
- .byte 139,77,8 // mov 0x8(%ebp),%ecx
- .byte 137,12,36 // mov %ecx,(%esp)
+ .byte 15,89,154,181,57,0,0 // mulps 0x39b5(%edx),%xmm3
+ .byte 141,80,8 // lea 0x8(%eax),%edx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 82 // push %edx
+ .byte 81 // push %ecx
.byte 255,80,4 // call *0x4(%eax)
- .byte 131,196,108 // add $0x6c,%esp
+ .byte 131,196,28 // add $0x1c,%esp
.byte 94 // pop %esi
.byte 95 // pop %edi
.byte 91 // pop %ebx
.byte 93 // pop %ebp
.byte 195 // ret
- .byte 137,217 // mov %ebx,%ecx
- .byte 128,225,3 // and $0x3,%cl
- .byte 128,249,1 // cmp $0x1,%cl
- .byte 116,50 // je 5562 <_sk_load_4444_sse2+0x111>
+ .byte 128,227,3 // and $0x3,%bl
+ .byte 128,251,1 // cmp $0x1,%bl
+ .byte 116,46 // je 427e <_sk_load_4444_sse2+0xd1>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
- .byte 128,249,2 // cmp $0x2,%cl
- .byte 116,23 // je 5550 <_sk_load_4444_sse2+0xff>
- .byte 128,249,3 // cmp $0x3,%cl
- .byte 15,133,85,255,255,255 // jne 5497 <_sk_load_4444_sse2+0x46>
- .byte 15,183,76,126,4 // movzwl 0x4(%esi,%edi,2),%ecx
- .byte 102,15,110,193 // movd %ecx,%xmm0
+ .byte 128,251,2 // cmp $0x2,%bl
+ .byte 116,19 // je 426c <_sk_load_4444_sse2+0xbf>
+ .byte 128,251,3 // cmp $0x3,%bl
+ .byte 117,131 // jne 41e1 <_sk_load_4444_sse2+0x34>
+ .byte 15,183,92,126,4 // movzwl 0x4(%esi,%edi,2),%ebx
+ .byte 102,15,110,195 // movd %ebx,%xmm0
.byte 102,15,112,216,69 // pshufd $0x45,%xmm0,%xmm3
.byte 102,15,110,4,126 // movd (%esi,%edi,2),%xmm0
.byte 102,15,97,192 // punpcklwd %xmm0,%xmm0
.byte 242,15,16,216 // movsd %xmm0,%xmm3
- .byte 233,53,255,255,255 // jmp 5497 <_sk_load_4444_sse2+0x46>
- .byte 15,183,12,126 // movzwl (%esi,%edi,2),%ecx
- .byte 102,15,110,217 // movd %ecx,%xmm3
- .byte 233,40,255,255,255 // jmp 5497 <_sk_load_4444_sse2+0x46>
+ .byte 233,99,255,255,255 // jmp 41e1 <_sk_load_4444_sse2+0x34>
+ .byte 15,183,52,126 // movzwl (%esi,%edi,2),%esi
+ .byte 102,15,110,222 // movd %esi,%xmm3
+ .byte 233,86,255,255,255 // jmp 41e1 <_sk_load_4444_sse2+0x34>
HIDDEN _sk_load_4444_dst_sse2
.globl _sk_load_4444_dst_sse2
@@ -55546,74 +54198,70 @@ _sk_load_4444_dst_sse2:
.byte 83 // push %ebx
.byte 87 // push %edi
.byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 232,0,0,0,0 // call 557d <_sk_load_4444_dst_sse2+0xe>
+ .byte 131,236,12 // sub $0xc,%esp
+ .byte 232,0,0,0,0 // call 4299 <_sk_load_4444_dst_sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
+ .byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 139,56 // mov (%eax),%edi
.byte 139,119,4 // mov 0x4(%edi),%esi
- .byte 15,175,117,20 // imul 0x14(%ebp),%esi
+ .byte 15,175,113,4 // imul 0x4(%ecx),%esi
.byte 1,246 // add %esi,%esi
.byte 3,55 // add (%edi),%esi
- .byte 139,93,24 // mov 0x18(%ebp),%ebx
+ .byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
- .byte 139,125,16 // mov 0x10(%ebp),%edi
- .byte 15,133,152,0,0,0 // jne 5634 <_sk_load_4444_dst_sse2+0xc5>
+ .byte 139,57 // mov (%ecx),%edi
+ .byte 15,133,128,0,0,0 // jne 433a <_sk_load_4444_dst_sse2+0xaf>
.byte 243,15,126,36,126 // movq (%esi,%edi,2),%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
- .byte 102,15,111,170,243,72,0,0 // movdqa 0x48f3(%edx),%xmm5
+ .byte 102,15,111,170,231,56,0,0 // movdqa 0x38e7(%edx),%xmm5
.byte 102,15,219,236 // pand %xmm4,%xmm5
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
- .byte 15,89,170,3,73,0,0 // mulps 0x4903(%edx),%xmm5
- .byte 102,15,111,178,19,73,0,0 // movdqa 0x4913(%edx),%xmm6
- .byte 102,15,219,244 // pand %xmm4,%xmm6
- .byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
- .byte 15,89,178,35,73,0,0 // mulps 0x4923(%edx),%xmm6
- .byte 102,15,111,186,51,73,0,0 // movdqa 0x4933(%edx),%xmm7
- .byte 102,15,219,252 // pand %xmm4,%xmm7
- .byte 15,91,255 // cvtdq2ps %xmm7,%xmm7
- .byte 15,89,186,67,73,0,0 // mulps 0x4943(%edx),%xmm7
- .byte 102,15,219,162,83,73,0,0 // pand 0x4953(%edx),%xmm4
+ .byte 15,89,170,247,56,0,0 // mulps 0x38f7(%edx),%xmm5
+ .byte 15,41,105,16 // movaps %xmm5,0x10(%ecx)
+ .byte 102,15,111,170,7,57,0,0 // movdqa 0x3907(%edx),%xmm5
+ .byte 102,15,219,236 // pand %xmm4,%xmm5
+ .byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
+ .byte 15,89,170,23,57,0,0 // mulps 0x3917(%edx),%xmm5
+ .byte 15,41,105,32 // movaps %xmm5,0x20(%ecx)
+ .byte 102,15,111,170,39,57,0,0 // movdqa 0x3927(%edx),%xmm5
+ .byte 102,15,219,236 // pand %xmm4,%xmm5
+ .byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
+ .byte 15,89,170,55,57,0,0 // mulps 0x3937(%edx),%xmm5
+ .byte 15,41,105,48 // movaps %xmm5,0x30(%ecx)
+ .byte 102,15,219,162,71,57,0,0 // pand 0x3947(%edx),%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,162,99,73,0,0 // mulps 0x4963(%edx),%xmm4
- .byte 141,72,8 // lea 0x8(%eax),%ecx
- .byte 137,92,36,16 // mov %ebx,0x10(%esp)
- .byte 139,85,20 // mov 0x14(%ebp),%edx
- .byte 137,84,36,12 // mov %edx,0xc(%esp)
- .byte 137,124,36,8 // mov %edi,0x8(%esp)
- .byte 137,76,36,4 // mov %ecx,0x4(%esp)
- .byte 139,77,8 // mov 0x8(%ebp),%ecx
- .byte 137,12,36 // mov %ecx,(%esp)
- .byte 15,41,100,36,80 // movaps %xmm4,0x50(%esp)
- .byte 15,41,124,36,64 // movaps %xmm7,0x40(%esp)
- .byte 15,41,116,36,48 // movaps %xmm6,0x30(%esp)
- .byte 15,41,108,36,32 // movaps %xmm5,0x20(%esp)
+ .byte 15,89,162,87,57,0,0 // mulps 0x3957(%edx),%xmm4
+ .byte 15,41,97,64 // movaps %xmm4,0x40(%ecx)
+ .byte 141,80,8 // lea 0x8(%eax),%edx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 82 // push %edx
+ .byte 81 // push %ecx
.byte 255,80,4 // call *0x4(%eax)
- .byte 131,196,108 // add $0x6c,%esp
+ .byte 131,196,28 // add $0x1c,%esp
.byte 94 // pop %esi
.byte 95 // pop %edi
.byte 91 // pop %ebx
.byte 93 // pop %ebp
.byte 195 // ret
- .byte 137,217 // mov %ebx,%ecx
- .byte 128,225,3 // and $0x3,%cl
- .byte 128,249,1 // cmp $0x1,%cl
- .byte 116,50 // je 5670 <_sk_load_4444_dst_sse2+0x101>
+ .byte 128,227,3 // and $0x3,%bl
+ .byte 128,251,1 // cmp $0x1,%bl
+ .byte 116,50 // je 4374 <_sk_load_4444_dst_sse2+0xe9>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
- .byte 128,249,2 // cmp $0x2,%cl
- .byte 116,23 // je 565e <_sk_load_4444_dst_sse2+0xef>
- .byte 128,249,3 // cmp $0x3,%cl
- .byte 15,133,85,255,255,255 // jne 55a5 <_sk_load_4444_dst_sse2+0x36>
- .byte 15,183,76,126,4 // movzwl 0x4(%esi,%edi,2),%ecx
- .byte 102,15,110,225 // movd %ecx,%xmm4
+ .byte 128,251,2 // cmp $0x2,%bl
+ .byte 116,23 // je 4362 <_sk_load_4444_dst_sse2+0xd7>
+ .byte 128,251,3 // cmp $0x3,%bl
+ .byte 15,133,111,255,255,255 // jne 42c3 <_sk_load_4444_dst_sse2+0x38>
+ .byte 15,183,92,126,4 // movzwl 0x4(%esi,%edi,2),%ebx
+ .byte 102,15,110,227 // movd %ebx,%xmm4
.byte 102,15,112,228,69 // pshufd $0x45,%xmm4,%xmm4
.byte 102,15,110,44,126 // movd (%esi,%edi,2),%xmm5
.byte 102,15,97,232 // punpcklwd %xmm0,%xmm5
.byte 242,15,16,229 // movsd %xmm5,%xmm4
- .byte 233,53,255,255,255 // jmp 55a5 <_sk_load_4444_dst_sse2+0x36>
- .byte 15,183,12,126 // movzwl (%esi,%edi,2),%ecx
- .byte 102,15,110,225 // movd %ecx,%xmm4
- .byte 233,40,255,255,255 // jmp 55a5 <_sk_load_4444_dst_sse2+0x36>
+ .byte 233,79,255,255,255 // jmp 42c3 <_sk_load_4444_dst_sse2+0x38>
+ .byte 15,183,52,126 // movzwl (%esi,%edi,2),%esi
+ .byte 102,15,110,230 // movd %esi,%xmm4
+ .byte 233,66,255,255,255 // jmp 42c3 <_sk_load_4444_dst_sse2+0x38>
HIDDEN _sk_gather_4444_sse2
.globl _sk_gather_4444_sse2
@@ -55621,18 +54269,12 @@ FUNCTION(_sk_gather_4444_sse2)
_sk_gather_4444_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 232,0,0,0,0 // call 568b <_sk_gather_4444_sse2+0xe>
- .byte 90 // pop %edx
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,77,12 // mov 0xc(%ebp),%ecx
- .byte 139,49 // mov (%ecx),%esi
- .byte 139,62 // mov (%esi),%edi
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 139,69,12 // mov 0xc(%ebp),%eax
+ .byte 139,8 // mov (%eax),%ecx
+ .byte 139,17 // mov (%ecx),%edx
.byte 243,15,91,201 // cvttps2dq %xmm1,%xmm1
- .byte 102,15,110,86,4 // movd 0x4(%esi),%xmm2
+ .byte 102,15,110,81,4 // movd 0x4(%ecx),%xmm2
.byte 102,15,112,210,0 // pshufd $0x0,%xmm2,%xmm2
.byte 102,15,112,217,245 // pshufd $0xf5,%xmm1,%xmm3
.byte 102,15,244,218 // pmuludq %xmm2,%xmm3
@@ -55642,58 +54284,44 @@ _sk_gather_4444_sse2:
.byte 102,15,98,203 // punpckldq %xmm3,%xmm1
.byte 243,15,91,192 // cvttps2dq %xmm0,%xmm0
.byte 102,15,254,193 // paddd %xmm1,%xmm0
- .byte 102,15,126,198 // movd %xmm0,%esi
+ .byte 102,15,126,193 // movd %xmm0,%ecx
.byte 102,15,112,200,229 // pshufd $0xe5,%xmm0,%xmm1
- .byte 102,15,196,28,119,0 // pinsrw $0x0,(%edi,%esi,2),%xmm3
- .byte 102,15,126,206 // movd %xmm1,%esi
+ .byte 102,15,196,28,74,0 // pinsrw $0x0,(%edx,%ecx,2),%xmm3
+ .byte 102,15,126,201 // movd %xmm1,%ecx
.byte 102,15,112,200,78 // pshufd $0x4e,%xmm0,%xmm1
- .byte 102,15,196,28,119,1 // pinsrw $0x1,(%edi,%esi,2),%xmm3
- .byte 102,15,126,206 // movd %xmm1,%esi
+ .byte 102,15,196,28,74,1 // pinsrw $0x1,(%edx,%ecx,2),%xmm3
+ .byte 102,15,126,201 // movd %xmm1,%ecx
.byte 102,15,112,192,231 // pshufd $0xe7,%xmm0,%xmm0
- .byte 15,183,52,119 // movzwl (%edi,%esi,2),%esi
- .byte 102,15,196,222,2 // pinsrw $0x2,%esi,%xmm3
- .byte 102,15,126,198 // movd %xmm0,%esi
- .byte 15,183,60,119 // movzwl (%edi,%esi,2),%edi
- .byte 139,117,16 // mov 0x10(%ebp),%esi
- .byte 102,15,196,223,3 // pinsrw $0x3,%edi,%xmm3
- .byte 139,125,20 // mov 0x14(%ebp),%edi
+ .byte 15,183,12,74 // movzwl (%edx,%ecx,2),%ecx
+ .byte 102,15,196,217,2 // pinsrw $0x2,%ecx,%xmm3
+ .byte 102,15,126,193 // movd %xmm0,%ecx
+ .byte 15,183,12,74 // movzwl (%edx,%ecx,2),%ecx
+ .byte 102,15,196,217,3 // pinsrw $0x3,%ecx,%xmm3
+ .byte 232,0,0,0,0 // call 4401 <_sk_gather_4444_sse2+0x80>
+ .byte 89 // pop %ecx
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 102,15,97,216 // punpcklwd %xmm0,%xmm3
- .byte 102,15,111,130,101,72,0,0 // movdqa 0x4865(%edx),%xmm0
+ .byte 102,15,111,129,255,55,0,0 // movdqa 0x37ff(%ecx),%xmm0
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,130,117,72,0,0 // mulps 0x4875(%edx),%xmm0
- .byte 102,15,111,138,133,72,0,0 // movdqa 0x4885(%edx),%xmm1
+ .byte 15,89,129,15,56,0,0 // mulps 0x380f(%ecx),%xmm0
+ .byte 102,15,111,137,31,56,0,0 // movdqa 0x381f(%ecx),%xmm1
.byte 102,15,219,203 // pand %xmm3,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,138,149,72,0,0 // mulps 0x4895(%edx),%xmm1
- .byte 102,15,111,146,165,72,0,0 // movdqa 0x48a5(%edx),%xmm2
+ .byte 15,89,137,47,56,0,0 // mulps 0x382f(%ecx),%xmm1
+ .byte 102,15,111,145,63,56,0,0 // movdqa 0x383f(%ecx),%xmm2
.byte 102,15,219,211 // pand %xmm3,%xmm2
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,146,181,72,0,0 // mulps 0x48b5(%edx),%xmm2
- .byte 102,15,219,154,197,72,0,0 // pand 0x48c5(%edx),%xmm3
+ .byte 15,89,145,79,56,0,0 // mulps 0x384f(%ecx),%xmm2
+ .byte 102,15,219,153,95,56,0,0 // pand 0x385f(%ecx),%xmm3
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,154,213,72,0,0 // mulps 0x48d5(%edx),%xmm3
- .byte 139,85,24 // mov 0x18(%ebp),%edx
- .byte 15,40,101,40 // movaps 0x28(%ebp),%xmm4
- .byte 15,40,109,56 // movaps 0x38(%ebp),%xmm5
- .byte 15,40,117,72 // movaps 0x48(%ebp),%xmm6
- .byte 15,40,125,88 // movaps 0x58(%ebp),%xmm7
- .byte 141,89,8 // lea 0x8(%ecx),%ebx
- .byte 15,41,124,36,80 // movaps %xmm7,0x50(%esp)
- .byte 15,41,116,36,64 // movaps %xmm6,0x40(%esp)
- .byte 15,41,108,36,48 // movaps %xmm5,0x30(%esp)
- .byte 15,41,100,36,32 // movaps %xmm4,0x20(%esp)
- .byte 137,84,36,16 // mov %edx,0x10(%esp)
- .byte 137,124,36,12 // mov %edi,0xc(%esp)
- .byte 137,116,36,8 // mov %esi,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
- .byte 255,81,4 // call *0x4(%ecx)
- .byte 131,196,108 // add $0x6c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 15,89,153,111,56,0,0 // mulps 0x386f(%ecx),%xmm3
+ .byte 141,72,8 // lea 0x8(%eax),%ecx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 81 // push %ecx
+ .byte 255,117,8 // pushl 0x8(%ebp)
+ .byte 255,80,4 // call *0x4(%eax)
+ .byte 131,196,24 // add $0x18,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -55706,10 +54334,19 @@ _sk_store_4444_sse2:
.byte 83 // push %ebx
.byte 87 // push %edi
.byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 232,0,0,0,0 // call 57bc <_sk_store_4444_sse2+0xe>
- .byte 88 // pop %eax
- .byte 15,40,160,180,71,0,0 // movaps 0x47b4(%eax),%xmm4
+ .byte 131,236,12 // sub $0xc,%esp
+ .byte 232,0,0,0,0 // call 447e <_sk_store_4444_sse2+0xe>
+ .byte 95 // pop %edi
+ .byte 139,69,12 // mov 0xc(%ebp),%eax
+ .byte 139,77,8 // mov 0x8(%ebp),%ecx
+ .byte 139,48 // mov (%eax),%esi
+ .byte 139,86,4 // mov 0x4(%esi),%edx
+ .byte 15,175,81,4 // imul 0x4(%ecx),%edx
+ .byte 1,210 // add %edx,%edx
+ .byte 3,22 // add (%esi),%edx
+ .byte 139,49 // mov (%ecx),%esi
+ .byte 15,40,167,2,56,0,0 // movaps 0x3802(%edi),%xmm4
+ .byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 15,40,232 // movaps %xmm0,%xmm5
.byte 15,89,236 // mulps %xmm4,%xmm5
.byte 102,15,91,237 // cvtps2dq %xmm5,%xmm5
@@ -55726,15 +54363,6 @@ _sk_store_4444_sse2:
.byte 15,89,227 // mulps %xmm3,%xmm4
.byte 102,15,91,228 // cvtps2dq %xmm4,%xmm4
.byte 102,15,86,229 // orpd %xmm5,%xmm4
- .byte 139,85,24 // mov 0x18(%ebp),%edx
- .byte 139,125,20 // mov 0x14(%ebp),%edi
- .byte 139,69,12 // mov 0xc(%ebp),%eax
- .byte 139,48 // mov (%eax),%esi
- .byte 139,94,4 // mov 0x4(%esi),%ebx
- .byte 15,175,223 // imul %edi,%ebx
- .byte 1,219 // add %ebx,%ebx
- .byte 3,30 // add (%esi),%ebx
- .byte 139,117,16 // mov 0x10(%ebp),%esi
.byte 102,15,86,230 // orpd %xmm6,%xmm4
.byte 102,15,114,244,16 // pslld $0x10,%xmm4
.byte 102,15,114,228,16 // psrad $0x10,%xmm4
@@ -55742,34 +54370,18 @@ _sk_store_4444_sse2:
.byte 102,15,126,101,232 // movd %xmm4,-0x18(%ebp)
.byte 102,15,112,236,229 // pshufd $0xe5,%xmm4,%xmm5
.byte 102,15,126,109,236 // movd %xmm5,-0x14(%ebp)
- .byte 133,210 // test %edx,%edx
- .byte 15,40,125,56 // movaps 0x38(%ebp),%xmm7
- .byte 15,40,117,40 // movaps 0x28(%ebp),%xmm6
- .byte 117,90 // jne 589f <_sk_store_4444_sse2+0xf1>
- .byte 137,208 // mov %edx,%eax
- .byte 137,250 // mov %edi,%edx
+ .byte 133,219 // test %ebx,%ebx
+ .byte 117,34 // jne 4521 <_sk_store_4444_sse2+0xb1>
.byte 102,15,126,231 // movd %xmm4,%edi
- .byte 102,15,126,233 // movd %xmm5,%ecx
- .byte 137,60,115 // mov %edi,(%ebx,%esi,2)
- .byte 137,215 // mov %edx,%edi
- .byte 137,194 // mov %eax,%edx
- .byte 139,69,12 // mov 0xc(%ebp),%eax
- .byte 137,76,115,4 // mov %ecx,0x4(%ebx,%esi,2)
- .byte 141,72,8 // lea 0x8(%eax),%ecx
- .byte 15,40,101,88 // movaps 0x58(%ebp),%xmm4
- .byte 15,41,100,36,80 // movaps %xmm4,0x50(%esp)
- .byte 15,40,101,72 // movaps 0x48(%ebp),%xmm4
- .byte 15,41,100,36,64 // movaps %xmm4,0x40(%esp)
- .byte 15,41,124,36,48 // movaps %xmm7,0x30(%esp)
- .byte 15,41,116,36,32 // movaps %xmm6,0x20(%esp)
- .byte 137,84,36,16 // mov %edx,0x10(%esp)
- .byte 137,124,36,12 // mov %edi,0xc(%esp)
- .byte 137,116,36,8 // mov %esi,0x8(%esp)
- .byte 137,76,36,4 // mov %ecx,0x4(%esp)
- .byte 139,77,8 // mov 0x8(%ebp),%ecx
- .byte 137,12,36 // mov %ecx,(%esp)
+ .byte 102,15,126,235 // movd %xmm5,%ebx
+ .byte 137,60,114 // mov %edi,(%edx,%esi,2)
+ .byte 137,92,114,4 // mov %ebx,0x4(%edx,%esi,2)
+ .byte 141,80,8 // lea 0x8(%eax),%edx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 82 // push %edx
+ .byte 81 // push %ecx
.byte 255,80,4 // call *0x4(%eax)
- .byte 131,196,108 // add $0x6c,%esp
+ .byte 131,196,28 // add $0x1c,%esp
.byte 94 // pop %esi
.byte 95 // pop %edi
.byte 91 // pop %ebx
@@ -55777,27 +54389,22 @@ _sk_store_4444_sse2:
.byte 195 // ret
.byte 243,15,126,101,232 // movq -0x18(%ebp),%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
- .byte 137,209 // mov %edx,%ecx
- .byte 128,225,3 // and $0x3,%cl
- .byte 128,249,1 // cmp $0x1,%cl
- .byte 116,41 // je 58db <_sk_store_4444_sse2+0x12d>
- .byte 128,249,2 // cmp $0x2,%cl
- .byte 116,19 // je 58ca <_sk_store_4444_sse2+0x11c>
- .byte 128,249,3 // cmp $0x3,%cl
- .byte 117,163 // jne 585f <_sk_store_4444_sse2+0xb1>
- .byte 137,249 // mov %edi,%ecx
+ .byte 128,227,3 // and $0x3,%bl
+ .byte 128,251,1 // cmp $0x1,%bl
+ .byte 116,37 // je 4557 <_sk_store_4444_sse2+0xe7>
+ .byte 128,251,2 // cmp $0x2,%bl
+ .byte 116,15 // je 4546 <_sk_store_4444_sse2+0xd6>
+ .byte 128,251,3 // cmp $0x3,%bl
+ .byte 117,210 // jne 450e <_sk_store_4444_sse2+0x9e>
.byte 102,15,197,252,4 // pextrw $0x4,%xmm4,%edi
- .byte 102,137,124,115,4 // mov %di,0x4(%ebx,%esi,2)
- .byte 137,207 // mov %ecx,%edi
+ .byte 102,137,124,114,4 // mov %di,0x4(%edx,%esi,2)
.byte 102,15,112,228,212 // pshufd $0xd4,%xmm4,%xmm4
.byte 242,15,112,228,232 // pshuflw $0xe8,%xmm4,%xmm4
- .byte 102,15,126,36,115 // movd %xmm4,(%ebx,%esi,2)
- .byte 235,132 // jmp 585f <_sk_store_4444_sse2+0xb1>
- .byte 137,249 // mov %edi,%ecx
+ .byte 102,15,126,36,114 // movd %xmm4,(%edx,%esi,2)
+ .byte 235,183 // jmp 450e <_sk_store_4444_sse2+0x9e>
.byte 102,15,126,231 // movd %xmm4,%edi
- .byte 102,137,60,115 // mov %di,(%ebx,%esi,2)
- .byte 137,207 // mov %ecx,%edi
- .byte 233,115,255,255,255 // jmp 585f <_sk_store_4444_sse2+0xb1>
+ .byte 102,137,60,114 // mov %di,(%edx,%esi,2)
+ .byte 235,173 // jmp 450e <_sk_store_4444_sse2+0x9e>
HIDDEN _sk_load_8888_sse2
.globl _sk_load_8888_sse2
@@ -55808,80 +54415,65 @@ _sk_load_8888_sse2:
.byte 83 // push %ebx
.byte 87 // push %edi
.byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 232,0,0,0,0 // call 58fa <_sk_load_8888_sse2+0xe>
- .byte 95 // pop %edi
- .byte 15,40,125,88 // movaps 0x58(%ebp),%xmm7
- .byte 15,40,117,72 // movaps 0x48(%ebp),%xmm6
- .byte 139,77,20 // mov 0x14(%ebp),%ecx
+ .byte 131,236,12 // sub $0xc,%esp
+ .byte 232,0,0,0,0 // call 456f <_sk_load_8888_sse2+0xe>
+ .byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
- .byte 139,48 // mov (%eax),%esi
- .byte 139,86,4 // mov 0x4(%esi),%edx
- .byte 15,175,209 // imul %ecx,%edx
- .byte 193,226,2 // shl $0x2,%edx
- .byte 3,22 // add (%esi),%edx
- .byte 139,93,24 // mov 0x18(%ebp),%ebx
+ .byte 139,77,8 // mov 0x8(%ebp),%ecx
+ .byte 139,56 // mov (%eax),%edi
+ .byte 139,119,4 // mov 0x4(%edi),%esi
+ .byte 15,175,113,4 // imul 0x4(%ecx),%esi
+ .byte 193,230,2 // shl $0x2,%esi
+ .byte 3,55 // add (%edi),%esi
+ .byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
- .byte 139,117,16 // mov 0x10(%ebp),%esi
- .byte 15,133,147,0,0,0 // jne 59b7 <_sk_load_8888_sse2+0xcb>
- .byte 243,15,111,44,178 // movdqu (%edx,%esi,4),%xmm5
- .byte 102,15,111,151,134,70,0,0 // movdqa 0x4686(%edi),%xmm2
- .byte 102,15,111,197 // movdqa %xmm5,%xmm0
+ .byte 139,57 // mov (%ecx),%edi
+ .byte 117,102 // jne 45f3 <_sk_load_8888_sse2+0x92>
+ .byte 243,15,111,28,190 // movdqu (%esi,%edi,4),%xmm3
+ .byte 102,15,111,146,33,55,0,0 // movdqa 0x3721(%edx),%xmm2
+ .byte 102,15,111,195 // movdqa %xmm3,%xmm0
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,40,167,150,70,0,0 // movaps 0x4696(%edi),%xmm4
+ .byte 15,40,162,49,55,0,0 // movaps 0x3731(%edx),%xmm4
.byte 15,89,196 // mulps %xmm4,%xmm0
- .byte 102,15,111,205 // movdqa %xmm5,%xmm1
+ .byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,114,209,8 // psrld $0x8,%xmm1
.byte 102,15,219,202 // pand %xmm2,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
.byte 15,89,204 // mulps %xmm4,%xmm1
- .byte 102,15,111,221 // movdqa %xmm5,%xmm3
- .byte 102,15,114,211,16 // psrld $0x10,%xmm3
- .byte 102,15,219,218 // pand %xmm2,%xmm3
- .byte 15,91,211 // cvtdq2ps %xmm3,%xmm2
+ .byte 102,15,111,235 // movdqa %xmm3,%xmm5
+ .byte 102,15,114,213,16 // psrld $0x10,%xmm5
+ .byte 102,15,219,234 // pand %xmm2,%xmm5
+ .byte 15,91,213 // cvtdq2ps %xmm5,%xmm2
.byte 15,89,212 // mulps %xmm4,%xmm2
- .byte 102,15,114,213,24 // psrld $0x18,%xmm5
- .byte 15,91,221 // cvtdq2ps %xmm5,%xmm3
+ .byte 102,15,114,211,24 // psrld $0x18,%xmm3
+ .byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
.byte 15,89,220 // mulps %xmm4,%xmm3
.byte 141,80,8 // lea 0x8(%eax),%edx
- .byte 15,41,124,36,80 // movaps %xmm7,0x50(%esp)
- .byte 15,41,116,36,64 // movaps %xmm6,0x40(%esp)
- .byte 15,40,101,56 // movaps 0x38(%ebp),%xmm4
- .byte 15,41,100,36,48 // movaps %xmm4,0x30(%esp)
- .byte 15,40,101,40 // movaps 0x28(%ebp),%xmm4
- .byte 15,41,100,36,32 // movaps %xmm4,0x20(%esp)
- .byte 137,92,36,16 // mov %ebx,0x10(%esp)
- .byte 137,76,36,12 // mov %ecx,0xc(%esp)
- .byte 137,116,36,8 // mov %esi,0x8(%esp)
- .byte 137,84,36,4 // mov %edx,0x4(%esp)
- .byte 139,77,8 // mov 0x8(%ebp),%ecx
- .byte 137,12,36 // mov %ecx,(%esp)
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 82 // push %edx
+ .byte 81 // push %ecx
.byte 255,80,4 // call *0x4(%eax)
- .byte 131,196,108 // add $0x6c,%esp
+ .byte 131,196,28 // add $0x1c,%esp
.byte 94 // pop %esi
.byte 95 // pop %edi
.byte 91 // pop %ebx
.byte 93 // pop %ebp
.byte 195 // ret
- .byte 137,217 // mov %ebx,%ecx
- .byte 136,77,243 // mov %cl,-0xd(%ebp)
- .byte 128,101,243,3 // andb $0x3,-0xd(%ebp)
- .byte 128,125,243,1 // cmpb $0x1,-0xd(%ebp)
- .byte 116,44 // je 59f2 <_sk_load_8888_sse2+0x106>
- .byte 102,15,239,237 // pxor %xmm5,%xmm5
- .byte 128,125,243,2 // cmpb $0x2,-0xd(%ebp)
- .byte 139,77,20 // mov 0x14(%ebp),%ecx
- .byte 116,21 // je 59e8 <_sk_load_8888_sse2+0xfc>
- .byte 128,125,243,3 // cmpb $0x3,-0xd(%ebp)
- .byte 15,133,76,255,255,255 // jne 5929 <_sk_load_8888_sse2+0x3d>
- .byte 102,15,110,68,178,8 // movd 0x8(%edx,%esi,4),%xmm0
- .byte 102,15,112,232,69 // pshufd $0x45,%xmm0,%xmm5
- .byte 102,15,18,44,178 // movlpd (%edx,%esi,4),%xmm5
- .byte 233,55,255,255,255 // jmp 5929 <_sk_load_8888_sse2+0x3d>
- .byte 102,15,110,44,178 // movd (%edx,%esi,4),%xmm5
- .byte 139,77,20 // mov 0x14(%ebp),%ecx
- .byte 233,42,255,255,255 // jmp 5929 <_sk_load_8888_sse2+0x3d>
+ .byte 128,227,3 // and $0x3,%bl
+ .byte 128,251,1 // cmp $0x1,%bl
+ .byte 116,35 // je 461e <_sk_load_8888_sse2+0xbd>
+ .byte 102,15,239,219 // pxor %xmm3,%xmm3
+ .byte 128,251,2 // cmp $0x2,%bl
+ .byte 116,16 // je 4614 <_sk_load_8888_sse2+0xb3>
+ .byte 128,251,3 // cmp $0x3,%bl
+ .byte 117,137 // jne 4592 <_sk_load_8888_sse2+0x31>
+ .byte 102,15,110,68,190,8 // movd 0x8(%esi,%edi,4),%xmm0
+ .byte 102,15,112,216,69 // pshufd $0x45,%xmm0,%xmm3
+ .byte 102,15,18,28,190 // movlpd (%esi,%edi,4),%xmm3
+ .byte 233,116,255,255,255 // jmp 4592 <_sk_load_8888_sse2+0x31>
+ .byte 102,15,110,28,190 // movd (%esi,%edi,4),%xmm3
+ .byte 233,106,255,255,255 // jmp 4592 <_sk_load_8888_sse2+0x31>
HIDDEN _sk_load_8888_dst_sse2
.globl _sk_load_8888_dst_sse2
@@ -55892,80 +54484,69 @@ _sk_load_8888_dst_sse2:
.byte 83 // push %ebx
.byte 87 // push %edi
.byte 86 // push %esi
- .byte 129,236,140,0,0,0 // sub $0x8c,%esp
- .byte 102,15,127,93,200 // movdqa %xmm3,-0x38(%ebp)
- .byte 15,41,85,216 // movaps %xmm2,-0x28(%ebp)
- .byte 232,0,0,0,0 // call 5a19 <_sk_load_8888_dst_sse2+0x1a>
- .byte 95 // pop %edi
- .byte 139,77,20 // mov 0x14(%ebp),%ecx
+ .byte 131,236,12 // sub $0xc,%esp
+ .byte 232,0,0,0,0 // call 4636 <_sk_load_8888_dst_sse2+0xe>
+ .byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
- .byte 139,48 // mov (%eax),%esi
- .byte 139,86,4 // mov 0x4(%esi),%edx
- .byte 15,175,209 // imul %ecx,%edx
- .byte 193,226,2 // shl $0x2,%edx
- .byte 3,22 // add (%esi),%edx
- .byte 139,93,24 // mov 0x18(%ebp),%ebx
+ .byte 139,77,8 // mov 0x8(%ebp),%ecx
+ .byte 139,56 // mov (%eax),%edi
+ .byte 139,119,4 // mov 0x4(%edi),%esi
+ .byte 15,175,113,4 // imul 0x4(%ecx),%esi
+ .byte 193,230,2 // shl $0x2,%esi
+ .byte 3,55 // add (%edi),%esi
+ .byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
- .byte 139,117,16 // mov 0x10(%ebp),%esi
- .byte 15,133,150,0,0,0 // jne 5ad1 <_sk_load_8888_dst_sse2+0xd2>
- .byte 243,15,111,28,178 // movdqu (%edx,%esi,4),%xmm3
- .byte 102,15,111,151,135,69,0,0 // movdqa 0x4587(%edi),%xmm2
- .byte 102,15,111,243 // movdqa %xmm3,%xmm6
- .byte 102,15,219,242 // pand %xmm2,%xmm6
+ .byte 139,57 // mov (%ecx),%edi
+ .byte 117,118 // jne 46ca <_sk_load_8888_dst_sse2+0xa2>
+ .byte 243,15,111,36,190 // movdqu (%esi,%edi,4),%xmm4
+ .byte 102,15,111,170,122,54,0,0 // movdqa 0x367a(%edx),%xmm5
+ .byte 102,15,111,244 // movdqa %xmm4,%xmm6
+ .byte 102,15,219,245 // pand %xmm5,%xmm6
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
- .byte 15,40,191,151,69,0,0 // movaps 0x4597(%edi),%xmm7
+ .byte 15,40,186,138,54,0,0 // movaps 0x368a(%edx),%xmm7
.byte 15,89,247 // mulps %xmm7,%xmm6
- .byte 102,15,111,227 // movdqa %xmm3,%xmm4
- .byte 102,15,114,212,8 // psrld $0x8,%xmm4
- .byte 102,15,219,226 // pand %xmm2,%xmm4
+ .byte 15,41,113,16 // movaps %xmm6,0x10(%ecx)
+ .byte 102,15,111,244 // movdqa %xmm4,%xmm6
+ .byte 102,15,114,214,8 // psrld $0x8,%xmm6
+ .byte 102,15,219,245 // pand %xmm5,%xmm6
+ .byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
+ .byte 15,89,247 // mulps %xmm7,%xmm6
+ .byte 15,41,113,32 // movaps %xmm6,0x20(%ecx)
+ .byte 102,15,111,244 // movdqa %xmm4,%xmm6
+ .byte 102,15,114,214,16 // psrld $0x10,%xmm6
+ .byte 102,15,219,245 // pand %xmm5,%xmm6
+ .byte 15,91,238 // cvtdq2ps %xmm6,%xmm5
+ .byte 15,89,239 // mulps %xmm7,%xmm5
+ .byte 15,41,105,48 // movaps %xmm5,0x30(%ecx)
+ .byte 102,15,114,212,24 // psrld $0x18,%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
.byte 15,89,231 // mulps %xmm7,%xmm4
- .byte 102,15,111,235 // movdqa %xmm3,%xmm5
- .byte 102,15,114,213,16 // psrld $0x10,%xmm5
- .byte 102,15,219,234 // pand %xmm2,%xmm5
- .byte 15,91,213 // cvtdq2ps %xmm5,%xmm2
- .byte 15,89,215 // mulps %xmm7,%xmm2
- .byte 102,15,114,211,24 // psrld $0x18,%xmm3
- .byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,223 // mulps %xmm7,%xmm3
+ .byte 15,41,97,64 // movaps %xmm4,0x40(%ecx)
.byte 141,80,8 // lea 0x8(%eax),%edx
- .byte 137,92,36,16 // mov %ebx,0x10(%esp)
- .byte 137,76,36,12 // mov %ecx,0xc(%esp)
- .byte 137,116,36,8 // mov %esi,0x8(%esp)
- .byte 137,84,36,4 // mov %edx,0x4(%esp)
- .byte 139,77,8 // mov 0x8(%ebp),%ecx
- .byte 137,12,36 // mov %ecx,(%esp)
- .byte 15,41,92,36,80 // movaps %xmm3,0x50(%esp)
- .byte 15,41,116,36,32 // movaps %xmm6,0x20(%esp)
- .byte 15,41,84,36,64 // movaps %xmm2,0x40(%esp)
- .byte 15,41,100,36,48 // movaps %xmm4,0x30(%esp)
- .byte 15,40,85,216 // movaps -0x28(%ebp),%xmm2
- .byte 15,40,93,200 // movaps -0x38(%ebp),%xmm3
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 82 // push %edx
+ .byte 81 // push %ecx
.byte 255,80,4 // call *0x4(%eax)
- .byte 129,196,140,0,0,0 // add $0x8c,%esp
+ .byte 131,196,28 // add $0x1c,%esp
.byte 94 // pop %esi
.byte 95 // pop %edi
.byte 91 // pop %ebx
.byte 93 // pop %ebp
.byte 195 // ret
- .byte 137,217 // mov %ebx,%ecx
- .byte 136,77,243 // mov %cl,-0xd(%ebp)
- .byte 128,101,243,3 // andb $0x3,-0xd(%ebp)
- .byte 128,125,243,1 // cmpb $0x1,-0xd(%ebp)
- .byte 116,44 // je 5b0c <_sk_load_8888_dst_sse2+0x10d>
- .byte 102,15,239,219 // pxor %xmm3,%xmm3
- .byte 128,125,243,2 // cmpb $0x2,-0xd(%ebp)
- .byte 139,77,20 // mov 0x14(%ebp),%ecx
- .byte 116,21 // je 5b02 <_sk_load_8888_dst_sse2+0x103>
- .byte 128,125,243,3 // cmpb $0x3,-0xd(%ebp)
- .byte 15,133,73,255,255,255 // jne 5a40 <_sk_load_8888_dst_sse2+0x41>
- .byte 102,15,110,100,178,8 // movd 0x8(%edx,%esi,4),%xmm4
- .byte 102,15,112,220,69 // pshufd $0x45,%xmm4,%xmm3
- .byte 102,15,18,28,178 // movlpd (%edx,%esi,4),%xmm3
- .byte 233,52,255,255,255 // jmp 5a40 <_sk_load_8888_dst_sse2+0x41>
- .byte 102,15,110,28,178 // movd (%edx,%esi,4),%xmm3
- .byte 139,77,20 // mov 0x14(%ebp),%ecx
- .byte 233,39,255,255,255 // jmp 5a40 <_sk_load_8888_dst_sse2+0x41>
+ .byte 128,227,3 // and $0x3,%bl
+ .byte 128,251,1 // cmp $0x1,%bl
+ .byte 116,39 // je 46f9 <_sk_load_8888_dst_sse2+0xd1>
+ .byte 102,15,239,228 // pxor %xmm4,%xmm4
+ .byte 128,251,2 // cmp $0x2,%bl
+ .byte 116,20 // je 46ef <_sk_load_8888_dst_sse2+0xc7>
+ .byte 128,251,3 // cmp $0x3,%bl
+ .byte 15,133,117,255,255,255 // jne 4659 <_sk_load_8888_dst_sse2+0x31>
+ .byte 102,15,110,100,190,8 // movd 0x8(%esi,%edi,4),%xmm4
+ .byte 102,15,112,228,69 // pshufd $0x45,%xmm4,%xmm4
+ .byte 102,15,18,36,190 // movlpd (%esi,%edi,4),%xmm4
+ .byte 233,96,255,255,255 // jmp 4659 <_sk_load_8888_dst_sse2+0x31>
+ .byte 102,15,110,36,190 // movd (%esi,%edi,4),%xmm4
+ .byte 233,86,255,255,255 // jmp 4659 <_sk_load_8888_dst_sse2+0x31>
HIDDEN _sk_gather_8888_sse2
.globl _sk_gather_8888_sse2
@@ -55973,18 +54554,12 @@ FUNCTION(_sk_gather_8888_sse2)
_sk_gather_8888_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 232,0,0,0,0 // call 5b27 <_sk_gather_8888_sse2+0xe>
- .byte 90 // pop %edx
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,77,12 // mov 0xc(%ebp),%ecx
- .byte 139,49 // mov (%ecx),%esi
- .byte 139,62 // mov (%esi),%edi
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 139,69,12 // mov 0xc(%ebp),%eax
+ .byte 139,8 // mov (%eax),%ecx
+ .byte 139,17 // mov (%ecx),%edx
.byte 243,15,91,201 // cvttps2dq %xmm1,%xmm1
- .byte 102,15,110,86,4 // movd 0x4(%esi),%xmm2
+ .byte 102,15,110,81,4 // movd 0x4(%ecx),%xmm2
.byte 102,15,112,210,0 // pshufd $0x0,%xmm2,%xmm2
.byte 102,15,112,217,245 // pshufd $0xf5,%xmm1,%xmm3
.byte 102,15,244,218 // pmuludq %xmm2,%xmm3
@@ -55996,59 +54571,45 @@ _sk_gather_8888_sse2:
.byte 102,15,254,193 // paddd %xmm1,%xmm0
.byte 102,15,112,200,229 // pshufd $0xe5,%xmm0,%xmm1
.byte 102,15,112,208,231 // pshufd $0xe7,%xmm0,%xmm2
- .byte 102,15,126,214 // movd %xmm2,%esi
- .byte 102,15,110,20,183 // movd (%edi,%esi,4),%xmm2
- .byte 102,15,126,206 // movd %xmm1,%esi
- .byte 102,15,110,12,183 // movd (%edi,%esi,4),%xmm1
- .byte 102,15,126,198 // movd %xmm0,%esi
+ .byte 102,15,126,209 // movd %xmm2,%ecx
+ .byte 102,15,110,20,138 // movd (%edx,%ecx,4),%xmm2
+ .byte 102,15,126,201 // movd %xmm1,%ecx
+ .byte 102,15,110,12,138 // movd (%edx,%ecx,4),%xmm1
+ .byte 102,15,126,193 // movd %xmm0,%ecx
.byte 102,15,112,192,78 // pshufd $0x4e,%xmm0,%xmm0
- .byte 102,15,110,28,183 // movd (%edi,%esi,4),%xmm3
- .byte 102,15,126,198 // movd %xmm0,%esi
- .byte 102,15,110,4,183 // movd (%edi,%esi,4),%xmm0
- .byte 139,117,16 // mov 0x10(%ebp),%esi
- .byte 139,125,20 // mov 0x14(%ebp),%edi
- .byte 102,15,111,162,153,68,0,0 // movdqa 0x4499(%edx),%xmm4
- .byte 15,40,170,169,68,0,0 // movaps 0x44a9(%edx),%xmm5
- .byte 139,85,24 // mov 0x18(%ebp),%edx
- .byte 15,40,117,40 // movaps 0x28(%ebp),%xmm6
- .byte 15,40,125,56 // movaps 0x38(%ebp),%xmm7
+ .byte 102,15,110,28,138 // movd (%edx,%ecx,4),%xmm3
+ .byte 102,15,126,193 // movd %xmm0,%ecx
+ .byte 102,15,110,4,138 // movd (%edx,%ecx,4),%xmm0
+ .byte 232,0,0,0,0 // call 4779 <_sk_gather_8888_sse2+0x76>
+ .byte 89 // pop %ecx
.byte 102,15,98,202 // punpckldq %xmm2,%xmm1
.byte 102,15,98,216 // punpckldq %xmm0,%xmm3
.byte 102,15,98,217 // punpckldq %xmm1,%xmm3
+ .byte 102,15,111,145,87,53,0,0 // movdqa 0x3557(%ecx),%xmm2
.byte 102,15,111,195 // movdqa %xmm3,%xmm0
- .byte 102,15,219,196 // pand %xmm4,%xmm0
+ .byte 102,15,219,194 // pand %xmm2,%xmm0
+ .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
+ .byte 15,40,161,103,53,0,0 // movaps 0x3567(%ecx),%xmm4
+ .byte 15,89,196 // mulps %xmm4,%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,114,209,8 // psrld $0x8,%xmm1
- .byte 102,15,219,204 // pand %xmm4,%xmm1
- .byte 102,15,111,211 // movdqa %xmm3,%xmm2
- .byte 102,15,114,210,16 // psrld $0x10,%xmm2
- .byte 102,15,219,212 // pand %xmm4,%xmm2
- .byte 15,40,101,72 // movaps 0x48(%ebp),%xmm4
- .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,197 // mulps %xmm5,%xmm0
+ .byte 102,15,219,202 // pand %xmm2,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,205 // mulps %xmm5,%xmm1
- .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,213 // mulps %xmm5,%xmm2
+ .byte 15,89,204 // mulps %xmm4,%xmm1
+ .byte 102,15,111,235 // movdqa %xmm3,%xmm5
+ .byte 102,15,114,213,16 // psrld $0x10,%xmm5
+ .byte 102,15,219,234 // pand %xmm2,%xmm5
+ .byte 15,91,213 // cvtdq2ps %xmm5,%xmm2
+ .byte 15,89,212 // mulps %xmm4,%xmm2
.byte 102,15,114,211,24 // psrld $0x18,%xmm3
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,221 // mulps %xmm5,%xmm3
- .byte 15,40,109,88 // movaps 0x58(%ebp),%xmm5
- .byte 141,89,8 // lea 0x8(%ecx),%ebx
- .byte 15,41,108,36,80 // movaps %xmm5,0x50(%esp)
- .byte 15,41,100,36,64 // movaps %xmm4,0x40(%esp)
- .byte 15,41,124,36,48 // movaps %xmm7,0x30(%esp)
- .byte 15,41,116,36,32 // movaps %xmm6,0x20(%esp)
- .byte 137,84,36,16 // mov %edx,0x10(%esp)
- .byte 137,124,36,12 // mov %edi,0xc(%esp)
- .byte 137,116,36,8 // mov %esi,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
- .byte 255,81,4 // call *0x4(%ecx)
- .byte 131,196,108 // add $0x6c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 15,89,220 // mulps %xmm4,%xmm3
+ .byte 141,72,8 // lea 0x8(%eax),%ecx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 81 // push %ecx
+ .byte 255,117,8 // pushl 0x8(%ebp)
+ .byte 255,80,4 // call *0x4(%eax)
+ .byte 131,196,24 // add $0x18,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -56061,10 +54622,19 @@ _sk_store_8888_sse2:
.byte 83 // push %ebx
.byte 87 // push %edi
.byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 232,0,0,0,0 // call 5c4c <_sk_store_8888_sse2+0xe>
- .byte 88 // pop %eax
- .byte 15,40,160,148,67,0,0 // movaps 0x4394(%eax),%xmm4
+ .byte 131,236,12 // sub $0xc,%esp
+ .byte 232,0,0,0,0 // call 47f4 <_sk_store_8888_sse2+0xe>
+ .byte 95 // pop %edi
+ .byte 139,69,12 // mov 0xc(%ebp),%eax
+ .byte 139,77,8 // mov 0x8(%ebp),%ecx
+ .byte 139,48 // mov (%eax),%esi
+ .byte 139,86,4 // mov 0x4(%esi),%edx
+ .byte 15,175,81,4 // imul 0x4(%ecx),%edx
+ .byte 193,226,2 // shl $0x2,%edx
+ .byte 3,22 // add (%esi),%edx
+ .byte 139,49 // mov (%ecx),%esi
+ .byte 15,40,167,252,52,0,0 // movaps 0x34fc(%edi),%xmm4
+ .byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 15,40,232 // movaps %xmm0,%xmm5
.byte 15,89,236 // mulps %xmm4,%xmm5
.byte 102,15,91,237 // cvtps2dq %xmm5,%xmm5
@@ -56078,61 +54648,37 @@ _sk_store_8888_sse2:
.byte 102,15,91,237 // cvtps2dq %xmm5,%xmm5
.byte 102,15,114,245,16 // pslld $0x10,%xmm5
.byte 15,89,227 // mulps %xmm3,%xmm4
- .byte 102,15,91,252 // cvtps2dq %xmm4,%xmm7
- .byte 102,15,114,247,24 // pslld $0x18,%xmm7
- .byte 102,15,235,253 // por %xmm5,%xmm7
- .byte 102,15,235,254 // por %xmm6,%xmm7
- .byte 15,40,117,56 // movaps 0x38(%ebp),%xmm6
- .byte 139,85,24 // mov 0x18(%ebp),%edx
- .byte 139,77,20 // mov 0x14(%ebp),%ecx
- .byte 139,69,12 // mov 0xc(%ebp),%eax
- .byte 139,48 // mov (%eax),%esi
- .byte 139,94,4 // mov 0x4(%esi),%ebx
- .byte 15,175,217 // imul %ecx,%ebx
- .byte 193,227,2 // shl $0x2,%ebx
- .byte 3,30 // add (%esi),%ebx
- .byte 139,125,16 // mov 0x10(%ebp),%edi
- .byte 133,210 // test %edx,%edx
- .byte 139,117,8 // mov 0x8(%ebp),%esi
- .byte 15,40,101,40 // movaps 0x28(%ebp),%xmm4
- .byte 117,66 // jne 5cfe <_sk_store_8888_sse2+0xc0>
- .byte 243,15,127,60,187 // movdqu %xmm7,(%ebx,%edi,4)
- .byte 141,88,8 // lea 0x8(%eax),%ebx
- .byte 15,40,109,88 // movaps 0x58(%ebp),%xmm5
- .byte 15,41,108,36,80 // movaps %xmm5,0x50(%esp)
- .byte 15,40,109,72 // movaps 0x48(%ebp),%xmm5
- .byte 15,41,108,36,64 // movaps %xmm5,0x40(%esp)
- .byte 15,41,116,36,48 // movaps %xmm6,0x30(%esp)
- .byte 15,41,100,36,32 // movaps %xmm4,0x20(%esp)
- .byte 137,84,36,16 // mov %edx,0x10(%esp)
- .byte 137,76,36,12 // mov %ecx,0xc(%esp)
- .byte 137,124,36,8 // mov %edi,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,52,36 // mov %esi,(%esp)
+ .byte 102,15,91,228 // cvtps2dq %xmm4,%xmm4
+ .byte 102,15,114,244,24 // pslld $0x18,%xmm4
+ .byte 102,15,235,229 // por %xmm5,%xmm4
+ .byte 102,15,235,230 // por %xmm6,%xmm4
+ .byte 133,219 // test %ebx,%ebx
+ .byte 117,24 // jne 4871 <_sk_store_8888_sse2+0x8b>
+ .byte 243,15,127,36,178 // movdqu %xmm4,(%edx,%esi,4)
+ .byte 141,80,8 // lea 0x8(%eax),%edx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 82 // push %edx
+ .byte 81 // push %ecx
.byte 255,80,4 // call *0x4(%eax)
- .byte 131,196,108 // add $0x6c,%esp
+ .byte 131,196,28 // add $0x1c,%esp
.byte 94 // pop %esi
.byte 95 // pop %edi
.byte 91 // pop %ebx
.byte 93 // pop %ebp
.byte 195 // ret
- .byte 137,209 // mov %edx,%ecx
- .byte 136,77,243 // mov %cl,-0xd(%ebp)
- .byte 128,101,243,3 // andb $0x3,-0xd(%ebp)
- .byte 128,125,243,1 // cmpb $0x1,-0xd(%ebp)
- .byte 116,33 // je 5d2e <_sk_store_8888_sse2+0xf0>
- .byte 128,125,243,2 // cmpb $0x2,-0xd(%ebp)
- .byte 139,77,20 // mov 0x14(%ebp),%ecx
- .byte 116,17 // je 5d27 <_sk_store_8888_sse2+0xe9>
- .byte 128,125,243,3 // cmpb $0x3,-0xd(%ebp)
- .byte 117,165 // jne 5cc1 <_sk_store_8888_sse2+0x83>
- .byte 102,15,112,239,78 // pshufd $0x4e,%xmm7,%xmm5
- .byte 102,15,126,108,187,8 // movd %xmm5,0x8(%ebx,%edi,4)
- .byte 102,15,214,60,187 // movq %xmm7,(%ebx,%edi,4)
- .byte 235,147 // jmp 5cc1 <_sk_store_8888_sse2+0x83>
- .byte 102,15,126,60,187 // movd %xmm7,(%ebx,%edi,4)
- .byte 139,77,20 // mov 0x14(%ebp),%ecx
- .byte 235,137 // jmp 5cc1 <_sk_store_8888_sse2+0x83>
+ .byte 128,227,3 // and $0x3,%bl
+ .byte 128,251,1 // cmp $0x1,%bl
+ .byte 116,28 // je 4895 <_sk_store_8888_sse2+0xaf>
+ .byte 128,251,2 // cmp $0x2,%bl
+ .byte 116,16 // je 488e <_sk_store_8888_sse2+0xa8>
+ .byte 128,251,3 // cmp $0x3,%bl
+ .byte 117,219 // jne 485e <_sk_store_8888_sse2+0x78>
+ .byte 102,15,112,236,78 // pshufd $0x4e,%xmm4,%xmm5
+ .byte 102,15,126,108,178,8 // movd %xmm5,0x8(%edx,%esi,4)
+ .byte 102,15,214,36,178 // movq %xmm4,(%edx,%esi,4)
+ .byte 235,201 // jmp 485e <_sk_store_8888_sse2+0x78>
+ .byte 102,15,126,36,178 // movd %xmm4,(%edx,%esi,4)
+ .byte 235,194 // jmp 485e <_sk_store_8888_sse2+0x78>
HIDDEN _sk_load_bgra_sse2
.globl _sk_load_bgra_sse2
@@ -56143,80 +54689,65 @@ _sk_load_bgra_sse2:
.byte 83 // push %ebx
.byte 87 // push %edi
.byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 232,0,0,0,0 // call 5d46 <_sk_load_bgra_sse2+0xe>
- .byte 95 // pop %edi
- .byte 15,40,125,88 // movaps 0x58(%ebp),%xmm7
- .byte 15,40,117,72 // movaps 0x48(%ebp),%xmm6
- .byte 139,77,20 // mov 0x14(%ebp),%ecx
+ .byte 131,236,12 // sub $0xc,%esp
+ .byte 232,0,0,0,0 // call 48aa <_sk_load_bgra_sse2+0xe>
+ .byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
- .byte 139,48 // mov (%eax),%esi
- .byte 139,86,4 // mov 0x4(%esi),%edx
- .byte 15,175,209 // imul %ecx,%edx
- .byte 193,226,2 // shl $0x2,%edx
- .byte 3,22 // add (%esi),%edx
- .byte 139,93,24 // mov 0x18(%ebp),%ebx
+ .byte 139,77,8 // mov 0x8(%ebp),%ecx
+ .byte 139,56 // mov (%eax),%edi
+ .byte 139,119,4 // mov 0x4(%edi),%esi
+ .byte 15,175,113,4 // imul 0x4(%ecx),%esi
+ .byte 193,230,2 // shl $0x2,%esi
+ .byte 3,55 // add (%edi),%esi
+ .byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
- .byte 139,117,16 // mov 0x10(%ebp),%esi
- .byte 15,133,147,0,0,0 // jne 5e03 <_sk_load_bgra_sse2+0xcb>
- .byte 243,15,111,44,178 // movdqu (%edx,%esi,4),%xmm5
- .byte 102,15,111,135,170,66,0,0 // movdqa 0x42aa(%edi),%xmm0
- .byte 102,15,111,205 // movdqa %xmm5,%xmm1
+ .byte 139,57 // mov (%ecx),%edi
+ .byte 117,102 // jne 492e <_sk_load_bgra_sse2+0x92>
+ .byte 243,15,111,28,190 // movdqu (%esi,%edi,4),%xmm3
+ .byte 102,15,111,130,86,52,0,0 // movdqa 0x3456(%edx),%xmm0
+ .byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,219,200 // pand %xmm0,%xmm1
.byte 15,91,209 // cvtdq2ps %xmm1,%xmm2
- .byte 15,40,167,186,66,0,0 // movaps 0x42ba(%edi),%xmm4
+ .byte 15,40,162,102,52,0,0 // movaps 0x3466(%edx),%xmm4
.byte 15,89,212 // mulps %xmm4,%xmm2
- .byte 102,15,111,205 // movdqa %xmm5,%xmm1
+ .byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,114,209,8 // psrld $0x8,%xmm1
.byte 102,15,219,200 // pand %xmm0,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
.byte 15,89,204 // mulps %xmm4,%xmm1
- .byte 102,15,111,221 // movdqa %xmm5,%xmm3
- .byte 102,15,114,211,16 // psrld $0x10,%xmm3
- .byte 102,15,219,216 // pand %xmm0,%xmm3
- .byte 15,91,195 // cvtdq2ps %xmm3,%xmm0
+ .byte 102,15,111,235 // movdqa %xmm3,%xmm5
+ .byte 102,15,114,213,16 // psrld $0x10,%xmm5
+ .byte 102,15,219,232 // pand %xmm0,%xmm5
+ .byte 15,91,197 // cvtdq2ps %xmm5,%xmm0
.byte 15,89,196 // mulps %xmm4,%xmm0
- .byte 102,15,114,213,24 // psrld $0x18,%xmm5
- .byte 15,91,221 // cvtdq2ps %xmm5,%xmm3
+ .byte 102,15,114,211,24 // psrld $0x18,%xmm3
+ .byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
.byte 15,89,220 // mulps %xmm4,%xmm3
.byte 141,80,8 // lea 0x8(%eax),%edx
- .byte 15,41,124,36,80 // movaps %xmm7,0x50(%esp)
- .byte 15,41,116,36,64 // movaps %xmm6,0x40(%esp)
- .byte 15,40,101,56 // movaps 0x38(%ebp),%xmm4
- .byte 15,41,100,36,48 // movaps %xmm4,0x30(%esp)
- .byte 15,40,101,40 // movaps 0x28(%ebp),%xmm4
- .byte 15,41,100,36,32 // movaps %xmm4,0x20(%esp)
- .byte 137,92,36,16 // mov %ebx,0x10(%esp)
- .byte 137,76,36,12 // mov %ecx,0xc(%esp)
- .byte 137,116,36,8 // mov %esi,0x8(%esp)
- .byte 137,84,36,4 // mov %edx,0x4(%esp)
- .byte 139,77,8 // mov 0x8(%ebp),%ecx
- .byte 137,12,36 // mov %ecx,(%esp)
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 82 // push %edx
+ .byte 81 // push %ecx
.byte 255,80,4 // call *0x4(%eax)
- .byte 131,196,108 // add $0x6c,%esp
+ .byte 131,196,28 // add $0x1c,%esp
.byte 94 // pop %esi
.byte 95 // pop %edi
.byte 91 // pop %ebx
.byte 93 // pop %ebp
.byte 195 // ret
- .byte 137,217 // mov %ebx,%ecx
- .byte 136,77,243 // mov %cl,-0xd(%ebp)
- .byte 128,101,243,3 // andb $0x3,-0xd(%ebp)
- .byte 128,125,243,1 // cmpb $0x1,-0xd(%ebp)
- .byte 116,44 // je 5e3e <_sk_load_bgra_sse2+0x106>
- .byte 102,15,239,237 // pxor %xmm5,%xmm5
- .byte 128,125,243,2 // cmpb $0x2,-0xd(%ebp)
- .byte 139,77,20 // mov 0x14(%ebp),%ecx
- .byte 116,21 // je 5e34 <_sk_load_bgra_sse2+0xfc>
- .byte 128,125,243,3 // cmpb $0x3,-0xd(%ebp)
- .byte 15,133,76,255,255,255 // jne 5d75 <_sk_load_bgra_sse2+0x3d>
- .byte 102,15,110,68,178,8 // movd 0x8(%edx,%esi,4),%xmm0
- .byte 102,15,112,232,69 // pshufd $0x45,%xmm0,%xmm5
- .byte 102,15,18,44,178 // movlpd (%edx,%esi,4),%xmm5
- .byte 233,55,255,255,255 // jmp 5d75 <_sk_load_bgra_sse2+0x3d>
- .byte 102,15,110,44,178 // movd (%edx,%esi,4),%xmm5
- .byte 139,77,20 // mov 0x14(%ebp),%ecx
- .byte 233,42,255,255,255 // jmp 5d75 <_sk_load_bgra_sse2+0x3d>
+ .byte 128,227,3 // and $0x3,%bl
+ .byte 128,251,1 // cmp $0x1,%bl
+ .byte 116,35 // je 4959 <_sk_load_bgra_sse2+0xbd>
+ .byte 102,15,239,219 // pxor %xmm3,%xmm3
+ .byte 128,251,2 // cmp $0x2,%bl
+ .byte 116,16 // je 494f <_sk_load_bgra_sse2+0xb3>
+ .byte 128,251,3 // cmp $0x3,%bl
+ .byte 117,137 // jne 48cd <_sk_load_bgra_sse2+0x31>
+ .byte 102,15,110,68,190,8 // movd 0x8(%esi,%edi,4),%xmm0
+ .byte 102,15,112,216,69 // pshufd $0x45,%xmm0,%xmm3
+ .byte 102,15,18,28,190 // movlpd (%esi,%edi,4),%xmm3
+ .byte 233,116,255,255,255 // jmp 48cd <_sk_load_bgra_sse2+0x31>
+ .byte 102,15,110,28,190 // movd (%esi,%edi,4),%xmm3
+ .byte 233,106,255,255,255 // jmp 48cd <_sk_load_bgra_sse2+0x31>
HIDDEN _sk_load_bgra_dst_sse2
.globl _sk_load_bgra_dst_sse2
@@ -56227,80 +54758,69 @@ _sk_load_bgra_dst_sse2:
.byte 83 // push %ebx
.byte 87 // push %edi
.byte 86 // push %esi
- .byte 129,236,140,0,0,0 // sub $0x8c,%esp
- .byte 102,15,127,93,200 // movdqa %xmm3,-0x38(%ebp)
- .byte 15,41,85,216 // movaps %xmm2,-0x28(%ebp)
- .byte 232,0,0,0,0 // call 5e65 <_sk_load_bgra_dst_sse2+0x1a>
- .byte 95 // pop %edi
- .byte 139,77,20 // mov 0x14(%ebp),%ecx
+ .byte 131,236,12 // sub $0xc,%esp
+ .byte 232,0,0,0,0 // call 4971 <_sk_load_bgra_dst_sse2+0xe>
+ .byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
- .byte 139,48 // mov (%eax),%esi
- .byte 139,86,4 // mov 0x4(%esi),%edx
- .byte 15,175,209 // imul %ecx,%edx
- .byte 193,226,2 // shl $0x2,%edx
- .byte 3,22 // add (%esi),%edx
- .byte 139,93,24 // mov 0x18(%ebp),%ebx
+ .byte 139,77,8 // mov 0x8(%ebp),%ecx
+ .byte 139,56 // mov (%eax),%edi
+ .byte 139,119,4 // mov 0x4(%edi),%esi
+ .byte 15,175,113,4 // imul 0x4(%ecx),%esi
+ .byte 193,230,2 // shl $0x2,%esi
+ .byte 3,55 // add (%edi),%esi
+ .byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
- .byte 139,117,16 // mov 0x10(%ebp),%esi
- .byte 15,133,150,0,0,0 // jne 5f1d <_sk_load_bgra_dst_sse2+0xd2>
- .byte 243,15,111,28,178 // movdqu (%edx,%esi,4),%xmm3
- .byte 102,15,111,151,171,65,0,0 // movdqa 0x41ab(%edi),%xmm2
- .byte 102,15,111,243 // movdqa %xmm3,%xmm6
- .byte 102,15,219,242 // pand %xmm2,%xmm6
+ .byte 139,57 // mov (%ecx),%edi
+ .byte 117,118 // jne 4a05 <_sk_load_bgra_dst_sse2+0xa2>
+ .byte 243,15,111,36,190 // movdqu (%esi,%edi,4),%xmm4
+ .byte 102,15,111,170,175,51,0,0 // movdqa 0x33af(%edx),%xmm5
+ .byte 102,15,111,244 // movdqa %xmm4,%xmm6
+ .byte 102,15,219,245 // pand %xmm5,%xmm6
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
- .byte 15,40,191,187,65,0,0 // movaps 0x41bb(%edi),%xmm7
+ .byte 15,40,186,191,51,0,0 // movaps 0x33bf(%edx),%xmm7
.byte 15,89,247 // mulps %xmm7,%xmm6
- .byte 102,15,111,227 // movdqa %xmm3,%xmm4
- .byte 102,15,114,212,8 // psrld $0x8,%xmm4
- .byte 102,15,219,226 // pand %xmm2,%xmm4
+ .byte 15,41,113,48 // movaps %xmm6,0x30(%ecx)
+ .byte 102,15,111,244 // movdqa %xmm4,%xmm6
+ .byte 102,15,114,214,8 // psrld $0x8,%xmm6
+ .byte 102,15,219,245 // pand %xmm5,%xmm6
+ .byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
+ .byte 15,89,247 // mulps %xmm7,%xmm6
+ .byte 15,41,113,32 // movaps %xmm6,0x20(%ecx)
+ .byte 102,15,111,244 // movdqa %xmm4,%xmm6
+ .byte 102,15,114,214,16 // psrld $0x10,%xmm6
+ .byte 102,15,219,245 // pand %xmm5,%xmm6
+ .byte 15,91,238 // cvtdq2ps %xmm6,%xmm5
+ .byte 15,89,239 // mulps %xmm7,%xmm5
+ .byte 15,41,105,16 // movaps %xmm5,0x10(%ecx)
+ .byte 102,15,114,212,24 // psrld $0x18,%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
.byte 15,89,231 // mulps %xmm7,%xmm4
- .byte 102,15,111,235 // movdqa %xmm3,%xmm5
- .byte 102,15,114,213,16 // psrld $0x10,%xmm5
- .byte 102,15,219,234 // pand %xmm2,%xmm5
- .byte 15,91,213 // cvtdq2ps %xmm5,%xmm2
- .byte 15,89,215 // mulps %xmm7,%xmm2
- .byte 102,15,114,211,24 // psrld $0x18,%xmm3
- .byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,223 // mulps %xmm7,%xmm3
+ .byte 15,41,97,64 // movaps %xmm4,0x40(%ecx)
.byte 141,80,8 // lea 0x8(%eax),%edx
- .byte 137,92,36,16 // mov %ebx,0x10(%esp)
- .byte 137,76,36,12 // mov %ecx,0xc(%esp)
- .byte 137,116,36,8 // mov %esi,0x8(%esp)
- .byte 137,84,36,4 // mov %edx,0x4(%esp)
- .byte 139,77,8 // mov 0x8(%ebp),%ecx
- .byte 137,12,36 // mov %ecx,(%esp)
- .byte 15,41,92,36,80 // movaps %xmm3,0x50(%esp)
- .byte 15,41,116,36,64 // movaps %xmm6,0x40(%esp)
- .byte 15,41,100,36,48 // movaps %xmm4,0x30(%esp)
- .byte 15,41,84,36,32 // movaps %xmm2,0x20(%esp)
- .byte 15,40,85,216 // movaps -0x28(%ebp),%xmm2
- .byte 15,40,93,200 // movaps -0x38(%ebp),%xmm3
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 82 // push %edx
+ .byte 81 // push %ecx
.byte 255,80,4 // call *0x4(%eax)
- .byte 129,196,140,0,0,0 // add $0x8c,%esp
+ .byte 131,196,28 // add $0x1c,%esp
.byte 94 // pop %esi
.byte 95 // pop %edi
.byte 91 // pop %ebx
.byte 93 // pop %ebp
.byte 195 // ret
- .byte 137,217 // mov %ebx,%ecx
- .byte 136,77,243 // mov %cl,-0xd(%ebp)
- .byte 128,101,243,3 // andb $0x3,-0xd(%ebp)
- .byte 128,125,243,1 // cmpb $0x1,-0xd(%ebp)
- .byte 116,44 // je 5f58 <_sk_load_bgra_dst_sse2+0x10d>
- .byte 102,15,239,219 // pxor %xmm3,%xmm3
- .byte 128,125,243,2 // cmpb $0x2,-0xd(%ebp)
- .byte 139,77,20 // mov 0x14(%ebp),%ecx
- .byte 116,21 // je 5f4e <_sk_load_bgra_dst_sse2+0x103>
- .byte 128,125,243,3 // cmpb $0x3,-0xd(%ebp)
- .byte 15,133,73,255,255,255 // jne 5e8c <_sk_load_bgra_dst_sse2+0x41>
- .byte 102,15,110,100,178,8 // movd 0x8(%edx,%esi,4),%xmm4
- .byte 102,15,112,220,69 // pshufd $0x45,%xmm4,%xmm3
- .byte 102,15,18,28,178 // movlpd (%edx,%esi,4),%xmm3
- .byte 233,52,255,255,255 // jmp 5e8c <_sk_load_bgra_dst_sse2+0x41>
- .byte 102,15,110,28,178 // movd (%edx,%esi,4),%xmm3
- .byte 139,77,20 // mov 0x14(%ebp),%ecx
- .byte 233,39,255,255,255 // jmp 5e8c <_sk_load_bgra_dst_sse2+0x41>
+ .byte 128,227,3 // and $0x3,%bl
+ .byte 128,251,1 // cmp $0x1,%bl
+ .byte 116,39 // je 4a34 <_sk_load_bgra_dst_sse2+0xd1>
+ .byte 102,15,239,228 // pxor %xmm4,%xmm4
+ .byte 128,251,2 // cmp $0x2,%bl
+ .byte 116,20 // je 4a2a <_sk_load_bgra_dst_sse2+0xc7>
+ .byte 128,251,3 // cmp $0x3,%bl
+ .byte 15,133,117,255,255,255 // jne 4994 <_sk_load_bgra_dst_sse2+0x31>
+ .byte 102,15,110,100,190,8 // movd 0x8(%esi,%edi,4),%xmm4
+ .byte 102,15,112,228,69 // pshufd $0x45,%xmm4,%xmm4
+ .byte 102,15,18,36,190 // movlpd (%esi,%edi,4),%xmm4
+ .byte 233,96,255,255,255 // jmp 4994 <_sk_load_bgra_dst_sse2+0x31>
+ .byte 102,15,110,36,190 // movd (%esi,%edi,4),%xmm4
+ .byte 233,86,255,255,255 // jmp 4994 <_sk_load_bgra_dst_sse2+0x31>
HIDDEN _sk_gather_bgra_sse2
.globl _sk_gather_bgra_sse2
@@ -56308,18 +54828,12 @@ FUNCTION(_sk_gather_bgra_sse2)
_sk_gather_bgra_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 232,0,0,0,0 // call 5f73 <_sk_gather_bgra_sse2+0xe>
- .byte 90 // pop %edx
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,77,12 // mov 0xc(%ebp),%ecx
- .byte 139,49 // mov (%ecx),%esi
- .byte 139,62 // mov (%esi),%edi
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 139,69,12 // mov 0xc(%ebp),%eax
+ .byte 139,8 // mov (%eax),%ecx
+ .byte 139,17 // mov (%ecx),%edx
.byte 243,15,91,201 // cvttps2dq %xmm1,%xmm1
- .byte 102,15,110,86,4 // movd 0x4(%esi),%xmm2
+ .byte 102,15,110,81,4 // movd 0x4(%ecx),%xmm2
.byte 102,15,112,210,0 // pshufd $0x0,%xmm2,%xmm2
.byte 102,15,112,217,245 // pshufd $0xf5,%xmm1,%xmm3
.byte 102,15,244,218 // pmuludq %xmm2,%xmm3
@@ -56331,59 +54845,45 @@ _sk_gather_bgra_sse2:
.byte 102,15,254,193 // paddd %xmm1,%xmm0
.byte 102,15,112,200,229 // pshufd $0xe5,%xmm0,%xmm1
.byte 102,15,112,208,231 // pshufd $0xe7,%xmm0,%xmm2
- .byte 102,15,126,214 // movd %xmm2,%esi
- .byte 102,15,110,20,183 // movd (%edi,%esi,4),%xmm2
- .byte 102,15,126,206 // movd %xmm1,%esi
- .byte 102,15,110,12,183 // movd (%edi,%esi,4),%xmm1
- .byte 102,15,126,198 // movd %xmm0,%esi
+ .byte 102,15,126,209 // movd %xmm2,%ecx
+ .byte 102,15,110,20,138 // movd (%edx,%ecx,4),%xmm2
+ .byte 102,15,126,201 // movd %xmm1,%ecx
+ .byte 102,15,110,12,138 // movd (%edx,%ecx,4),%xmm1
+ .byte 102,15,126,193 // movd %xmm0,%ecx
.byte 102,15,112,192,78 // pshufd $0x4e,%xmm0,%xmm0
- .byte 102,15,110,28,183 // movd (%edi,%esi,4),%xmm3
- .byte 102,15,126,198 // movd %xmm0,%esi
- .byte 102,15,110,4,183 // movd (%edi,%esi,4),%xmm0
- .byte 139,117,16 // mov 0x10(%ebp),%esi
- .byte 139,125,20 // mov 0x14(%ebp),%edi
- .byte 102,15,111,162,189,64,0,0 // movdqa 0x40bd(%edx),%xmm4
- .byte 15,40,170,205,64,0,0 // movaps 0x40cd(%edx),%xmm5
- .byte 139,85,24 // mov 0x18(%ebp),%edx
- .byte 15,40,117,40 // movaps 0x28(%ebp),%xmm6
- .byte 15,40,125,56 // movaps 0x38(%ebp),%xmm7
+ .byte 102,15,110,28,138 // movd (%edx,%ecx,4),%xmm3
+ .byte 102,15,126,193 // movd %xmm0,%ecx
+ .byte 102,15,110,4,138 // movd (%edx,%ecx,4),%xmm0
+ .byte 232,0,0,0,0 // call 4ab4 <_sk_gather_bgra_sse2+0x76>
+ .byte 89 // pop %ecx
.byte 102,15,98,202 // punpckldq %xmm2,%xmm1
.byte 102,15,98,216 // punpckldq %xmm0,%xmm3
.byte 102,15,98,217 // punpckldq %xmm1,%xmm3
- .byte 102,15,111,211 // movdqa %xmm3,%xmm2
- .byte 102,15,219,212 // pand %xmm4,%xmm2
+ .byte 102,15,111,129,140,50,0,0 // movdqa 0x328c(%ecx),%xmm0
+ .byte 102,15,111,203 // movdqa %xmm3,%xmm1
+ .byte 102,15,219,200 // pand %xmm0,%xmm1
+ .byte 15,91,209 // cvtdq2ps %xmm1,%xmm2
+ .byte 15,40,161,156,50,0,0 // movaps 0x329c(%ecx),%xmm4
+ .byte 15,89,212 // mulps %xmm4,%xmm2
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,114,209,8 // psrld $0x8,%xmm1
- .byte 102,15,219,204 // pand %xmm4,%xmm1
- .byte 102,15,111,195 // movdqa %xmm3,%xmm0
- .byte 102,15,114,208,16 // psrld $0x10,%xmm0
- .byte 102,15,219,196 // pand %xmm4,%xmm0
- .byte 15,40,101,72 // movaps 0x48(%ebp),%xmm4
- .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,213 // mulps %xmm5,%xmm2
+ .byte 102,15,219,200 // pand %xmm0,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,205 // mulps %xmm5,%xmm1
- .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,197 // mulps %xmm5,%xmm0
+ .byte 15,89,204 // mulps %xmm4,%xmm1
+ .byte 102,15,111,235 // movdqa %xmm3,%xmm5
+ .byte 102,15,114,213,16 // psrld $0x10,%xmm5
+ .byte 102,15,219,232 // pand %xmm0,%xmm5
+ .byte 15,91,197 // cvtdq2ps %xmm5,%xmm0
+ .byte 15,89,196 // mulps %xmm4,%xmm0
.byte 102,15,114,211,24 // psrld $0x18,%xmm3
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,221 // mulps %xmm5,%xmm3
- .byte 15,40,109,88 // movaps 0x58(%ebp),%xmm5
- .byte 141,89,8 // lea 0x8(%ecx),%ebx
- .byte 15,41,108,36,80 // movaps %xmm5,0x50(%esp)
- .byte 15,41,100,36,64 // movaps %xmm4,0x40(%esp)
- .byte 15,41,124,36,48 // movaps %xmm7,0x30(%esp)
- .byte 15,41,116,36,32 // movaps %xmm6,0x20(%esp)
- .byte 137,84,36,16 // mov %edx,0x10(%esp)
- .byte 137,124,36,12 // mov %edi,0xc(%esp)
- .byte 137,116,36,8 // mov %esi,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
- .byte 255,81,4 // call *0x4(%ecx)
- .byte 131,196,108 // add $0x6c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 15,89,220 // mulps %xmm4,%xmm3
+ .byte 141,72,8 // lea 0x8(%eax),%ecx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 81 // push %ecx
+ .byte 255,117,8 // pushl 0x8(%ebp)
+ .byte 255,80,4 // call *0x4(%eax)
+ .byte 131,196,24 // add $0x18,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -56396,10 +54896,19 @@ _sk_store_bgra_sse2:
.byte 83 // push %ebx
.byte 87 // push %edi
.byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 232,0,0,0,0 // call 6098 <_sk_store_bgra_sse2+0xe>
- .byte 88 // pop %eax
- .byte 15,40,160,184,63,0,0 // movaps 0x3fb8(%eax),%xmm4
+ .byte 131,236,12 // sub $0xc,%esp
+ .byte 232,0,0,0,0 // call 4b2f <_sk_store_bgra_sse2+0xe>
+ .byte 95 // pop %edi
+ .byte 139,69,12 // mov 0xc(%ebp),%eax
+ .byte 139,77,8 // mov 0x8(%ebp),%ecx
+ .byte 139,48 // mov (%eax),%esi
+ .byte 139,86,4 // mov 0x4(%esi),%edx
+ .byte 15,175,81,4 // imul 0x4(%ecx),%edx
+ .byte 193,226,2 // shl $0x2,%edx
+ .byte 3,22 // add (%esi),%edx
+ .byte 139,49 // mov (%ecx),%esi
+ .byte 15,40,167,49,50,0,0 // movaps 0x3231(%edi),%xmm4
+ .byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 15,40,234 // movaps %xmm2,%xmm5
.byte 15,89,236 // mulps %xmm4,%xmm5
.byte 102,15,91,237 // cvtps2dq %xmm5,%xmm5
@@ -56413,61 +54922,37 @@ _sk_store_bgra_sse2:
.byte 102,15,91,237 // cvtps2dq %xmm5,%xmm5
.byte 102,15,114,245,16 // pslld $0x10,%xmm5
.byte 15,89,227 // mulps %xmm3,%xmm4
- .byte 102,15,91,252 // cvtps2dq %xmm4,%xmm7
- .byte 102,15,114,247,24 // pslld $0x18,%xmm7
- .byte 102,15,235,253 // por %xmm5,%xmm7
- .byte 102,15,235,254 // por %xmm6,%xmm7
- .byte 15,40,117,56 // movaps 0x38(%ebp),%xmm6
- .byte 139,85,24 // mov 0x18(%ebp),%edx
- .byte 139,77,20 // mov 0x14(%ebp),%ecx
- .byte 139,69,12 // mov 0xc(%ebp),%eax
- .byte 139,48 // mov (%eax),%esi
- .byte 139,94,4 // mov 0x4(%esi),%ebx
- .byte 15,175,217 // imul %ecx,%ebx
- .byte 193,227,2 // shl $0x2,%ebx
- .byte 3,30 // add (%esi),%ebx
- .byte 139,125,16 // mov 0x10(%ebp),%edi
- .byte 133,210 // test %edx,%edx
- .byte 139,117,8 // mov 0x8(%ebp),%esi
- .byte 15,40,101,40 // movaps 0x28(%ebp),%xmm4
- .byte 117,66 // jne 614a <_sk_store_bgra_sse2+0xc0>
- .byte 243,15,127,60,187 // movdqu %xmm7,(%ebx,%edi,4)
- .byte 141,88,8 // lea 0x8(%eax),%ebx
- .byte 15,40,109,88 // movaps 0x58(%ebp),%xmm5
- .byte 15,41,108,36,80 // movaps %xmm5,0x50(%esp)
- .byte 15,40,109,72 // movaps 0x48(%ebp),%xmm5
- .byte 15,41,108,36,64 // movaps %xmm5,0x40(%esp)
- .byte 15,41,116,36,48 // movaps %xmm6,0x30(%esp)
- .byte 15,41,100,36,32 // movaps %xmm4,0x20(%esp)
- .byte 137,84,36,16 // mov %edx,0x10(%esp)
- .byte 137,76,36,12 // mov %ecx,0xc(%esp)
- .byte 137,124,36,8 // mov %edi,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,52,36 // mov %esi,(%esp)
+ .byte 102,15,91,228 // cvtps2dq %xmm4,%xmm4
+ .byte 102,15,114,244,24 // pslld $0x18,%xmm4
+ .byte 102,15,235,229 // por %xmm5,%xmm4
+ .byte 102,15,235,230 // por %xmm6,%xmm4
+ .byte 133,219 // test %ebx,%ebx
+ .byte 117,24 // jne 4bac <_sk_store_bgra_sse2+0x8b>
+ .byte 243,15,127,36,178 // movdqu %xmm4,(%edx,%esi,4)
+ .byte 141,80,8 // lea 0x8(%eax),%edx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 82 // push %edx
+ .byte 81 // push %ecx
.byte 255,80,4 // call *0x4(%eax)
- .byte 131,196,108 // add $0x6c,%esp
+ .byte 131,196,28 // add $0x1c,%esp
.byte 94 // pop %esi
.byte 95 // pop %edi
.byte 91 // pop %ebx
.byte 93 // pop %ebp
.byte 195 // ret
- .byte 137,209 // mov %edx,%ecx
- .byte 136,77,243 // mov %cl,-0xd(%ebp)
- .byte 128,101,243,3 // andb $0x3,-0xd(%ebp)
- .byte 128,125,243,1 // cmpb $0x1,-0xd(%ebp)
- .byte 116,33 // je 617a <_sk_store_bgra_sse2+0xf0>
- .byte 128,125,243,2 // cmpb $0x2,-0xd(%ebp)
- .byte 139,77,20 // mov 0x14(%ebp),%ecx
- .byte 116,17 // je 6173 <_sk_store_bgra_sse2+0xe9>
- .byte 128,125,243,3 // cmpb $0x3,-0xd(%ebp)
- .byte 117,165 // jne 610d <_sk_store_bgra_sse2+0x83>
- .byte 102,15,112,239,78 // pshufd $0x4e,%xmm7,%xmm5
- .byte 102,15,126,108,187,8 // movd %xmm5,0x8(%ebx,%edi,4)
- .byte 102,15,214,60,187 // movq %xmm7,(%ebx,%edi,4)
- .byte 235,147 // jmp 610d <_sk_store_bgra_sse2+0x83>
- .byte 102,15,126,60,187 // movd %xmm7,(%ebx,%edi,4)
- .byte 139,77,20 // mov 0x14(%ebp),%ecx
- .byte 235,137 // jmp 610d <_sk_store_bgra_sse2+0x83>
+ .byte 128,227,3 // and $0x3,%bl
+ .byte 128,251,1 // cmp $0x1,%bl
+ .byte 116,28 // je 4bd0 <_sk_store_bgra_sse2+0xaf>
+ .byte 128,251,2 // cmp $0x2,%bl
+ .byte 116,16 // je 4bc9 <_sk_store_bgra_sse2+0xa8>
+ .byte 128,251,3 // cmp $0x3,%bl
+ .byte 117,219 // jne 4b99 <_sk_store_bgra_sse2+0x78>
+ .byte 102,15,112,236,78 // pshufd $0x4e,%xmm4,%xmm5
+ .byte 102,15,126,108,178,8 // movd %xmm5,0x8(%edx,%esi,4)
+ .byte 102,15,214,36,178 // movq %xmm4,(%edx,%esi,4)
+ .byte 235,201 // jmp 4b99 <_sk_store_bgra_sse2+0x78>
+ .byte 102,15,126,36,178 // movd %xmm4,(%edx,%esi,4)
+ .byte 235,194 // jmp 4b99 <_sk_store_bgra_sse2+0x78>
HIDDEN _sk_load_f16_sse2
.globl _sk_load_f16_sse2
@@ -56478,138 +54963,126 @@ _sk_load_f16_sse2:
.byte 83 // push %ebx
.byte 87 // push %edi
.byte 86 // push %esi
- .byte 129,236,188,0,0,0 // sub $0xbc,%esp
- .byte 232,0,0,0,0 // call 6195 <_sk_load_f16_sse2+0x11>
- .byte 91 // pop %ebx
- .byte 139,77,20 // mov 0x14(%ebp),%ecx
+ .byte 131,236,92 // sub $0x5c,%esp
+ .byte 232,0,0,0,0 // call 4be5 <_sk_load_f16_sse2+0xe>
+ .byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
- .byte 139,48 // mov (%eax),%esi
- .byte 139,86,4 // mov 0x4(%esi),%edx
- .byte 15,175,209 // imul %ecx,%edx
- .byte 193,226,3 // shl $0x3,%edx
- .byte 3,22 // add (%esi),%edx
- .byte 139,125,24 // mov 0x18(%ebp),%edi
- .byte 133,255 // test %edi,%edi
- .byte 139,117,16 // mov 0x10(%ebp),%esi
- .byte 15,133,220,1,0,0 // jne 6393 <_sk_load_f16_sse2+0x20f>
- .byte 102,15,16,4,242 // movupd (%edx,%esi,8),%xmm0
- .byte 243,15,111,76,242,16 // movdqu 0x10(%edx,%esi,8),%xmm1
- .byte 102,15,40,208 // movapd %xmm0,%xmm2
- .byte 102,15,97,209 // punpcklwd %xmm1,%xmm2
+ .byte 139,77,8 // mov 0x8(%ebp),%ecx
+ .byte 139,56 // mov (%eax),%edi
+ .byte 139,119,4 // mov 0x4(%edi),%esi
+ .byte 15,175,113,4 // imul 0x4(%ecx),%esi
+ .byte 193,230,3 // shl $0x3,%esi
+ .byte 3,55 // add (%edi),%esi
+ .byte 139,89,8 // mov 0x8(%ecx),%ebx
+ .byte 133,219 // test %ebx,%ebx
+ .byte 139,57 // mov (%ecx),%edi
+ .byte 15,133,160,1,0,0 // jne 4da7 <_sk_load_f16_sse2+0x1d0>
+ .byte 102,15,16,4,254 // movupd (%esi,%edi,8),%xmm0
+ .byte 243,15,111,76,254,16 // movdqu 0x10(%esi,%edi,8),%xmm1
+ .byte 102,15,40,216 // movapd %xmm0,%xmm3
+ .byte 102,15,97,217 // punpcklwd %xmm1,%xmm3
.byte 102,15,105,193 // punpckhwd %xmm1,%xmm0
- .byte 102,15,111,202 // movdqa %xmm2,%xmm1
- .byte 102,15,97,200 // punpcklwd %xmm0,%xmm1
- .byte 102,15,105,208 // punpckhwd %xmm0,%xmm2
- .byte 102,15,126,77,208 // movd %xmm1,-0x30(%ebp)
- .byte 102,15,112,193,229 // pshufd $0xe5,%xmm1,%xmm0
+ .byte 102,15,111,211 // movdqa %xmm3,%xmm2
+ .byte 102,15,97,208 // punpcklwd %xmm0,%xmm2
+ .byte 102,15,105,216 // punpckhwd %xmm0,%xmm3
+ .byte 102,15,126,85,208 // movd %xmm2,-0x30(%ebp)
+ .byte 102,15,112,194,229 // pshufd $0xe5,%xmm2,%xmm0
.byte 102,15,126,69,212 // movd %xmm0,-0x2c(%ebp)
- .byte 243,15,126,117,208 // movq -0x30(%ebp),%xmm6
- .byte 102,15,112,193,231 // pshufd $0xe7,%xmm1,%xmm0
+ .byte 243,15,126,77,208 // movq -0x30(%ebp),%xmm1
+ .byte 102,15,112,194,231 // pshufd $0xe7,%xmm2,%xmm0
.byte 102,15,126,69,220 // movd %xmm0,-0x24(%ebp)
- .byte 102,15,112,193,78 // pshufd $0x4e,%xmm1,%xmm0
+ .byte 102,15,112,194,78 // pshufd $0x4e,%xmm2,%xmm0
.byte 102,15,126,69,216 // movd %xmm0,-0x28(%ebp)
- .byte 243,15,126,101,216 // movq -0x28(%ebp),%xmm4
- .byte 102,15,126,85,224 // movd %xmm2,-0x20(%ebp)
- .byte 102,15,112,194,229 // pshufd $0xe5,%xmm2,%xmm0
+ .byte 243,15,126,125,216 // movq -0x28(%ebp),%xmm7
+ .byte 102,15,126,93,224 // movd %xmm3,-0x20(%ebp)
+ .byte 102,15,112,195,229 // pshufd $0xe5,%xmm3,%xmm0
.byte 102,15,126,69,228 // movd %xmm0,-0x1c(%ebp)
- .byte 243,15,126,125,224 // movq -0x20(%ebp),%xmm7
- .byte 102,15,112,194,231 // pshufd $0xe7,%xmm2,%xmm0
+ .byte 243,15,126,109,224 // movq -0x20(%ebp),%xmm5
+ .byte 102,15,112,195,231 // pshufd $0xe7,%xmm3,%xmm0
.byte 102,15,126,69,236 // movd %xmm0,-0x14(%ebp)
- .byte 102,15,112,194,78 // pshufd $0x4e,%xmm2,%xmm0
+ .byte 102,15,112,195,78 // pshufd $0x4e,%xmm3,%xmm0
.byte 102,15,126,69,232 // movd %xmm0,-0x18(%ebp)
- .byte 102,15,239,219 // pxor %xmm3,%xmm3
- .byte 102,15,97,243 // punpcklwd %xmm3,%xmm6
- .byte 102,15,111,171,203,62,0,0 // movdqa 0x3ecb(%ebx),%xmm5
- .byte 102,15,111,214 // movdqa %xmm6,%xmm2
- .byte 102,15,219,213 // pand %xmm5,%xmm2
- .byte 102,15,239,242 // pxor %xmm2,%xmm6
- .byte 102,15,114,242,16 // pslld $0x10,%xmm2
- .byte 102,15,111,206 // movdqa %xmm6,%xmm1
- .byte 102,15,114,241,13 // pslld $0xd,%xmm1
- .byte 102,15,235,202 // por %xmm2,%xmm1
- .byte 102,15,111,212 // movdqa %xmm4,%xmm2
- .byte 102,15,97,211 // punpcklwd %xmm3,%xmm2
- .byte 102,15,111,226 // movdqa %xmm2,%xmm4
- .byte 102,15,219,229 // pand %xmm5,%xmm4
- .byte 102,15,239,212 // pxor %xmm4,%xmm2
- .byte 102,15,127,85,152 // movdqa %xmm2,-0x68(%ebp)
+ .byte 102,15,239,192 // pxor %xmm0,%xmm0
+ .byte 102,15,97,200 // punpcklwd %xmm0,%xmm1
+ .byte 102,15,111,154,139,49,0,0 // movdqa 0x318b(%edx),%xmm3
+ .byte 102,15,111,225 // movdqa %xmm1,%xmm4
+ .byte 102,15,219,227 // pand %xmm3,%xmm4
+ .byte 102,15,239,204 // pxor %xmm4,%xmm1
.byte 102,15,114,244,16 // pslld $0x10,%xmm4
+ .byte 102,15,111,209 // movdqa %xmm1,%xmm2
.byte 102,15,114,242,13 // pslld $0xd,%xmm2
.byte 102,15,235,212 // por %xmm4,%xmm2
+ .byte 102,15,97,248 // punpcklwd %xmm0,%xmm7
.byte 102,15,111,231 // movdqa %xmm7,%xmm4
- .byte 102,15,97,227 // punpcklwd %xmm3,%xmm4
- .byte 102,15,111,252 // movdqa %xmm4,%xmm7
- .byte 102,15,219,253 // pand %xmm5,%xmm7
- .byte 102,15,239,231 // pxor %xmm7,%xmm4
- .byte 102,15,127,101,168 // movdqa %xmm4,-0x58(%ebp)
+ .byte 102,15,219,227 // pand %xmm3,%xmm4
+ .byte 102,15,239,252 // pxor %xmm4,%xmm7
+ .byte 102,15,127,125,152 // movdqa %xmm7,-0x68(%ebp)
+ .byte 102,15,114,244,16 // pslld $0x10,%xmm4
+ .byte 102,15,111,247 // movdqa %xmm7,%xmm6
+ .byte 102,15,114,246,13 // pslld $0xd,%xmm6
+ .byte 102,15,235,244 // por %xmm4,%xmm6
+ .byte 102,15,97,232 // punpcklwd %xmm0,%xmm5
+ .byte 102,15,111,253 // movdqa %xmm5,%xmm7
+ .byte 102,15,219,251 // pand %xmm3,%xmm7
+ .byte 102,15,239,239 // pxor %xmm7,%xmm5
+ .byte 102,15,127,109,168 // movdqa %xmm5,-0x58(%ebp)
.byte 102,15,114,247,16 // pslld $0x10,%xmm7
- .byte 102,15,114,244,13 // pslld $0xd,%xmm4
- .byte 102,15,235,231 // por %xmm7,%xmm4
+ .byte 102,15,114,245,13 // pslld $0xd,%xmm5
+ .byte 102,15,235,239 // por %xmm7,%xmm5
.byte 243,15,126,125,232 // movq -0x18(%ebp),%xmm7
- .byte 102,15,97,251 // punpcklwd %xmm3,%xmm7
- .byte 102,15,219,239 // pand %xmm7,%xmm5
- .byte 102,15,239,253 // pxor %xmm5,%xmm7
- .byte 102,15,114,245,16 // pslld $0x10,%xmm5
+ .byte 102,15,97,248 // punpcklwd %xmm0,%xmm7
+ .byte 102,15,219,223 // pand %xmm7,%xmm3
+ .byte 102,15,239,251 // pxor %xmm3,%xmm7
+ .byte 102,15,114,243,16 // pslld $0x10,%xmm3
.byte 102,15,111,199 // movdqa %xmm7,%xmm0
.byte 102,15,114,240,13 // pslld $0xd,%xmm0
- .byte 102,15,235,197 // por %xmm5,%xmm0
- .byte 102,15,111,155,219,62,0,0 // movdqa 0x3edb(%ebx),%xmm3
- .byte 102,15,254,203 // paddd %xmm3,%xmm1
+ .byte 102,15,235,195 // por %xmm3,%xmm0
+ .byte 102,15,111,154,155,49,0,0 // movdqa 0x319b(%edx),%xmm3
.byte 102,15,254,211 // paddd %xmm3,%xmm2
- .byte 102,15,254,227 // paddd %xmm3,%xmm4
+ .byte 102,15,254,243 // paddd %xmm3,%xmm6
+ .byte 102,15,254,235 // paddd %xmm3,%xmm5
.byte 102,15,254,195 // paddd %xmm3,%xmm0
- .byte 102,15,111,155,235,62,0,0 // movdqa 0x3eeb(%ebx),%xmm3
+ .byte 102,15,111,154,171,49,0,0 // movdqa 0x31ab(%edx),%xmm3
.byte 102,15,127,93,184 // movdqa %xmm3,-0x48(%ebp)
- .byte 102,15,239,243 // pxor %xmm3,%xmm6
- .byte 102,15,111,155,251,62,0,0 // movdqa 0x3efb(%ebx),%xmm3
- .byte 102,15,111,235 // movdqa %xmm3,%xmm5
- .byte 102,15,102,238 // pcmpgtd %xmm6,%xmm5
- .byte 102,15,223,233 // pandn %xmm1,%xmm5
- .byte 102,15,111,117,152 // movdqa -0x68(%ebp),%xmm6
- .byte 102,15,239,117,184 // pxor -0x48(%ebp),%xmm6
+ .byte 102,15,239,203 // pxor %xmm3,%xmm1
+ .byte 102,15,111,154,187,49,0,0 // movdqa 0x31bb(%edx),%xmm3
+ .byte 102,15,111,227 // movdqa %xmm3,%xmm4
+ .byte 102,15,102,225 // pcmpgtd %xmm1,%xmm4
+ .byte 102,15,223,226 // pandn %xmm2,%xmm4
+ .byte 102,15,111,85,152 // movdqa -0x68(%ebp),%xmm2
+ .byte 102,15,239,85,184 // pxor -0x48(%ebp),%xmm2
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
- .byte 102,15,102,206 // pcmpgtd %xmm6,%xmm1
- .byte 102,15,223,202 // pandn %xmm2,%xmm1
+ .byte 102,15,102,202 // pcmpgtd %xmm2,%xmm1
+ .byte 102,15,223,206 // pandn %xmm6,%xmm1
.byte 102,15,111,117,168 // movdqa -0x58(%ebp),%xmm6
.byte 102,15,239,117,184 // pxor -0x48(%ebp),%xmm6
.byte 102,15,111,211 // movdqa %xmm3,%xmm2
.byte 102,15,102,214 // pcmpgtd %xmm6,%xmm2
- .byte 102,15,223,212 // pandn %xmm4,%xmm2
+ .byte 102,15,223,213 // pandn %xmm5,%xmm2
.byte 102,15,239,125,184 // pxor -0x48(%ebp),%xmm7
.byte 102,15,102,223 // pcmpgtd %xmm7,%xmm3
.byte 102,15,223,216 // pandn %xmm0,%xmm3
.byte 141,80,8 // lea 0x8(%eax),%edx
- .byte 15,40,69,88 // movaps 0x58(%ebp),%xmm0
- .byte 15,41,68,36,80 // movaps %xmm0,0x50(%esp)
- .byte 15,40,69,72 // movaps 0x48(%ebp),%xmm0
- .byte 15,41,68,36,64 // movaps %xmm0,0x40(%esp)
- .byte 15,40,69,56 // movaps 0x38(%ebp),%xmm0
- .byte 15,41,68,36,48 // movaps %xmm0,0x30(%esp)
- .byte 15,40,69,40 // movaps 0x28(%ebp),%xmm0
- .byte 15,41,68,36,32 // movaps %xmm0,0x20(%esp)
- .byte 137,124,36,16 // mov %edi,0x10(%esp)
- .byte 137,76,36,12 // mov %ecx,0xc(%esp)
- .byte 137,116,36,8 // mov %esi,0x8(%esp)
- .byte 137,84,36,4 // mov %edx,0x4(%esp)
- .byte 139,77,8 // mov 0x8(%ebp),%ecx
- .byte 137,12,36 // mov %ecx,(%esp)
- .byte 102,15,111,197 // movdqa %xmm5,%xmm0
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 102,15,111,196 // movdqa %xmm4,%xmm0
+ .byte 82 // push %edx
+ .byte 81 // push %ecx
.byte 255,80,4 // call *0x4(%eax)
- .byte 129,196,188,0,0,0 // add $0xbc,%esp
+ .byte 131,196,108 // add $0x6c,%esp
.byte 94 // pop %esi
.byte 95 // pop %edi
.byte 91 // pop %ebx
.byte 93 // pop %ebp
.byte 195 // ret
- .byte 242,15,16,4,242 // movsd (%edx,%esi,8),%xmm0
+ .byte 242,15,16,4,254 // movsd (%esi,%edi,8),%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
- .byte 131,255,1 // cmp $0x1,%edi
- .byte 15,132,29,254,255,255 // je 61c2 <_sk_load_f16_sse2+0x3e>
- .byte 102,15,22,68,242,8 // movhpd 0x8(%edx,%esi,8),%xmm0
- .byte 131,255,3 // cmp $0x3,%edi
- .byte 15,130,14,254,255,255 // jb 61c2 <_sk_load_f16_sse2+0x3e>
- .byte 243,15,126,76,242,16 // movq 0x10(%edx,%esi,8),%xmm1
- .byte 233,3,254,255,255 // jmp 61c2 <_sk_load_f16_sse2+0x3e>
+ .byte 131,251,1 // cmp $0x1,%ebx
+ .byte 15,132,89,254,255,255 // je 4c12 <_sk_load_f16_sse2+0x3b>
+ .byte 102,15,22,68,254,8 // movhpd 0x8(%esi,%edi,8),%xmm0
+ .byte 131,251,3 // cmp $0x3,%ebx
+ .byte 15,130,74,254,255,255 // jb 4c12 <_sk_load_f16_sse2+0x3b>
+ .byte 243,15,126,76,254,16 // movq 0x10(%esi,%edi,8),%xmm1
+ .byte 233,63,254,255,255 // jmp 4c12 <_sk_load_f16_sse2+0x3b>
HIDDEN _sk_load_f16_dst_sse2
.globl _sk_load_f16_dst_sse2
@@ -56620,142 +55093,139 @@ _sk_load_f16_dst_sse2:
.byte 83 // push %ebx
.byte 87 // push %edi
.byte 86 // push %esi
- .byte 129,236,252,0,0,0 // sub $0xfc,%esp
- .byte 15,41,157,88,255,255,255 // movaps %xmm3,-0xa8(%ebp)
- .byte 102,15,127,149,104,255,255,255 // movdqa %xmm2,-0x98(%ebp)
- .byte 15,41,141,120,255,255,255 // movaps %xmm1,-0x88(%ebp)
- .byte 102,15,127,69,136 // movdqa %xmm0,-0x78(%ebp)
- .byte 232,0,0,0,0 // call 63eb <_sk_load_f16_dst_sse2+0x2c>
- .byte 91 // pop %ebx
- .byte 139,77,20 // mov 0x14(%ebp),%ecx
+ .byte 129,236,140,0,0,0 // sub $0x8c,%esp
+ .byte 15,41,157,104,255,255,255 // movaps %xmm3,-0x98(%ebp)
+ .byte 15,41,149,120,255,255,255 // movaps %xmm2,-0x88(%ebp)
+ .byte 102,15,127,77,136 // movdqa %xmm1,-0x78(%ebp)
+ .byte 15,41,69,152 // movaps %xmm0,-0x68(%ebp)
+ .byte 232,0,0,0,0 // call 4dfb <_sk_load_f16_dst_sse2+0x28>
+ .byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
- .byte 139,48 // mov (%eax),%esi
- .byte 139,86,4 // mov 0x4(%esi),%edx
- .byte 15,175,209 // imul %ecx,%edx
- .byte 193,226,3 // shl $0x3,%edx
- .byte 3,22 // add (%esi),%edx
- .byte 139,125,24 // mov 0x18(%ebp),%edi
- .byte 133,255 // test %edi,%edi
- .byte 139,117,16 // mov 0x10(%ebp),%esi
- .byte 15,133,233,1,0,0 // jne 65f6 <_sk_load_f16_dst_sse2+0x237>
- .byte 102,15,16,12,242 // movupd (%edx,%esi,8),%xmm1
- .byte 243,15,111,68,242,16 // movdqu 0x10(%edx,%esi,8),%xmm0
- .byte 102,15,40,217 // movapd %xmm1,%xmm3
+ .byte 139,77,8 // mov 0x8(%ebp),%ecx
+ .byte 139,56 // mov (%eax),%edi
+ .byte 139,119,4 // mov 0x4(%edi),%esi
+ .byte 15,175,113,4 // imul 0x4(%ecx),%esi
+ .byte 193,230,3 // shl $0x3,%esi
+ .byte 3,55 // add (%edi),%esi
+ .byte 139,89,8 // mov 0x8(%ecx),%ebx
+ .byte 133,219 // test %ebx,%ebx
+ .byte 139,57 // mov (%ecx),%edi
+ .byte 15,133,206,1,0,0 // jne 4feb <_sk_load_f16_dst_sse2+0x218>
+ .byte 102,15,16,4,254 // movupd (%esi,%edi,8),%xmm0
+ .byte 243,15,111,76,254,16 // movdqu 0x10(%esi,%edi,8),%xmm1
+ .byte 102,15,40,208 // movapd %xmm0,%xmm2
+ .byte 102,15,97,209 // punpcklwd %xmm1,%xmm2
+ .byte 102,15,105,193 // punpckhwd %xmm1,%xmm0
+ .byte 102,15,111,218 // movdqa %xmm2,%xmm3
.byte 102,15,97,216 // punpcklwd %xmm0,%xmm3
- .byte 102,15,105,200 // punpckhwd %xmm0,%xmm1
- .byte 102,15,111,195 // movdqa %xmm3,%xmm0
- .byte 102,15,97,193 // punpcklwd %xmm1,%xmm0
- .byte 102,15,105,217 // punpckhwd %xmm1,%xmm3
- .byte 102,15,126,69,208 // movd %xmm0,-0x30(%ebp)
- .byte 102,15,112,200,229 // pshufd $0xe5,%xmm0,%xmm1
- .byte 102,15,126,77,212 // movd %xmm1,-0x2c(%ebp)
- .byte 243,15,126,117,208 // movq -0x30(%ebp),%xmm6
- .byte 102,15,112,200,231 // pshufd $0xe7,%xmm0,%xmm1
- .byte 102,15,126,77,220 // movd %xmm1,-0x24(%ebp)
- .byte 102,15,112,192,78 // pshufd $0x4e,%xmm0,%xmm0
- .byte 102,15,126,69,216 // movd %xmm0,-0x28(%ebp)
- .byte 243,15,126,109,216 // movq -0x28(%ebp),%xmm5
- .byte 102,15,126,93,224 // movd %xmm3,-0x20(%ebp)
+ .byte 102,15,105,208 // punpckhwd %xmm0,%xmm2
+ .byte 102,15,126,93,208 // movd %xmm3,-0x30(%ebp)
.byte 102,15,112,195,229 // pshufd $0xe5,%xmm3,%xmm0
- .byte 102,15,126,69,228 // movd %xmm0,-0x1c(%ebp)
- .byte 243,15,126,77,224 // movq -0x20(%ebp),%xmm1
+ .byte 102,15,126,69,212 // movd %xmm0,-0x2c(%ebp)
+ .byte 243,15,126,101,208 // movq -0x30(%ebp),%xmm4
.byte 102,15,112,195,231 // pshufd $0xe7,%xmm3,%xmm0
- .byte 102,15,126,69,236 // movd %xmm0,-0x14(%ebp)
+ .byte 102,15,126,69,220 // movd %xmm0,-0x24(%ebp)
.byte 102,15,112,195,78 // pshufd $0x4e,%xmm3,%xmm0
- .byte 102,15,126,69,232 // movd %xmm0,-0x18(%ebp)
- .byte 102,15,239,192 // pxor %xmm0,%xmm0
- .byte 102,15,97,240 // punpcklwd %xmm0,%xmm6
- .byte 102,15,239,228 // pxor %xmm4,%xmm4
- .byte 102,15,111,155,181,60,0,0 // movdqa 0x3cb5(%ebx),%xmm3
- .byte 102,15,111,198 // movdqa %xmm6,%xmm0
- .byte 102,15,219,195 // pand %xmm3,%xmm0
- .byte 102,15,239,240 // pxor %xmm0,%xmm6
- .byte 102,15,114,240,16 // pslld $0x10,%xmm0
+ .byte 102,15,126,69,216 // movd %xmm0,-0x28(%ebp)
+ .byte 243,15,126,69,216 // movq -0x28(%ebp),%xmm0
+ .byte 102,15,126,85,224 // movd %xmm2,-0x20(%ebp)
+ .byte 102,15,112,218,229 // pshufd $0xe5,%xmm2,%xmm3
+ .byte 102,15,126,93,228 // movd %xmm3,-0x1c(%ebp)
+ .byte 243,15,126,109,224 // movq -0x20(%ebp),%xmm5
+ .byte 102,15,112,218,231 // pshufd $0xe7,%xmm2,%xmm3
+ .byte 102,15,126,93,236 // movd %xmm3,-0x14(%ebp)
+ .byte 102,15,112,210,78 // pshufd $0x4e,%xmm2,%xmm2
+ .byte 102,15,126,85,232 // movd %xmm2,-0x18(%ebp)
+ .byte 102,15,239,201 // pxor %xmm1,%xmm1
+ .byte 102,15,97,225 // punpcklwd %xmm1,%xmm4
+ .byte 102,15,111,154,181,47,0,0 // movdqa 0x2fb5(%edx),%xmm3
+ .byte 102,15,111,212 // movdqa %xmm4,%xmm2
+ .byte 102,15,219,211 // pand %xmm3,%xmm2
+ .byte 102,15,239,226 // pxor %xmm2,%xmm4
+ .byte 102,15,114,242,16 // pslld $0x10,%xmm2
+ .byte 102,15,111,204 // movdqa %xmm4,%xmm1
+ .byte 102,15,114,241,13 // pslld $0xd,%xmm1
+ .byte 102,15,235,202 // por %xmm2,%xmm1
+ .byte 102,15,111,146,213,47,0,0 // movdqa 0x2fd5(%edx),%xmm2
+ .byte 102,15,127,85,168 // movdqa %xmm2,-0x58(%ebp)
+ .byte 102,15,239,226 // pxor %xmm2,%xmm4
+ .byte 102,15,111,178,229,47,0,0 // movdqa 0x2fe5(%edx),%xmm6
.byte 102,15,111,254 // movdqa %xmm6,%xmm7
+ .byte 102,15,102,252 // pcmpgtd %xmm4,%xmm7
+ .byte 102,15,111,146,197,47,0,0 // movdqa 0x2fc5(%edx),%xmm2
+ .byte 102,15,127,85,184 // movdqa %xmm2,-0x48(%ebp)
+ .byte 102,15,254,202 // paddd %xmm2,%xmm1
+ .byte 102,15,223,249 // pandn %xmm1,%xmm7
+ .byte 243,15,126,85,232 // movq -0x18(%ebp),%xmm2
+ .byte 102,15,127,121,16 // movdqa %xmm7,0x10(%ecx)
+ .byte 102,15,239,201 // pxor %xmm1,%xmm1
+ .byte 102,15,97,193 // punpcklwd %xmm1,%xmm0
+ .byte 102,15,111,200 // movdqa %xmm0,%xmm1
+ .byte 102,15,219,203 // pand %xmm3,%xmm1
+ .byte 102,15,239,193 // pxor %xmm1,%xmm0
+ .byte 102,15,114,241,16 // pslld $0x10,%xmm1
+ .byte 102,15,111,248 // movdqa %xmm0,%xmm7
.byte 102,15,114,247,13 // pslld $0xd,%xmm7
- .byte 102,15,235,248 // por %xmm0,%xmm7
- .byte 102,15,97,236 // punpcklwd %xmm4,%xmm5
+ .byte 102,15,235,249 // por %xmm1,%xmm7
+ .byte 102,15,111,101,168 // movdqa -0x58(%ebp),%xmm4
+ .byte 102,15,239,196 // pxor %xmm4,%xmm0
+ .byte 102,15,111,206 // movdqa %xmm6,%xmm1
+ .byte 102,15,102,200 // pcmpgtd %xmm0,%xmm1
+ .byte 102,15,254,125,184 // paddd -0x48(%ebp),%xmm7
+ .byte 102,15,223,207 // pandn %xmm7,%xmm1
+ .byte 102,15,127,73,32 // movdqa %xmm1,0x20(%ecx)
+ .byte 102,15,239,255 // pxor %xmm7,%xmm7
+ .byte 102,15,97,239 // punpcklwd %xmm7,%xmm5
.byte 102,15,111,197 // movdqa %xmm5,%xmm0
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 102,15,239,232 // pxor %xmm0,%xmm5
- .byte 102,15,127,109,152 // movdqa %xmm5,-0x68(%ebp)
.byte 102,15,114,240,16 // pslld $0x10,%xmm0
- .byte 102,15,114,245,13 // pslld $0xd,%xmm5
- .byte 102,15,235,232 // por %xmm0,%xmm5
- .byte 102,15,239,210 // pxor %xmm2,%xmm2
- .byte 102,15,97,202 // punpcklwd %xmm2,%xmm1
- .byte 102,15,111,193 // movdqa %xmm1,%xmm0
- .byte 102,15,219,195 // pand %xmm3,%xmm0
- .byte 102,15,239,200 // pxor %xmm0,%xmm1
- .byte 102,15,127,77,168 // movdqa %xmm1,-0x58(%ebp)
- .byte 102,15,114,240,16 // pslld $0x10,%xmm0
- .byte 102,15,111,225 // movdqa %xmm1,%xmm4
- .byte 102,15,114,244,13 // pslld $0xd,%xmm4
- .byte 102,15,235,224 // por %xmm0,%xmm4
- .byte 243,15,126,77,232 // movq -0x18(%ebp),%xmm1
- .byte 102,15,97,202 // punpcklwd %xmm2,%xmm1
- .byte 102,15,219,217 // pand %xmm1,%xmm3
- .byte 102,15,239,203 // pxor %xmm3,%xmm1
+ .byte 102,15,111,205 // movdqa %xmm5,%xmm1
+ .byte 102,15,114,241,13 // pslld $0xd,%xmm1
+ .byte 102,15,235,200 // por %xmm0,%xmm1
+ .byte 102,15,239,236 // pxor %xmm4,%xmm5
+ .byte 102,15,111,198 // movdqa %xmm6,%xmm0
+ .byte 102,15,102,197 // pcmpgtd %xmm5,%xmm0
+ .byte 102,15,111,109,184 // movdqa -0x48(%ebp),%xmm5
+ .byte 102,15,254,205 // paddd %xmm5,%xmm1
+ .byte 102,15,223,193 // pandn %xmm1,%xmm0
+ .byte 102,15,127,65,48 // movdqa %xmm0,0x30(%ecx)
+ .byte 102,15,97,215 // punpcklwd %xmm7,%xmm2
+ .byte 102,15,219,218 // pand %xmm2,%xmm3
+ .byte 102,15,239,211 // pxor %xmm3,%xmm2
.byte 102,15,114,243,16 // pslld $0x10,%xmm3
- .byte 102,15,111,209 // movdqa %xmm1,%xmm2
- .byte 102,15,114,242,13 // pslld $0xd,%xmm2
- .byte 102,15,235,211 // por %xmm3,%xmm2
- .byte 102,15,111,155,197,60,0,0 // movdqa 0x3cc5(%ebx),%xmm3
- .byte 102,15,254,251 // paddd %xmm3,%xmm7
- .byte 102,15,254,235 // paddd %xmm3,%xmm5
- .byte 102,15,254,227 // paddd %xmm3,%xmm4
- .byte 102,15,254,211 // paddd %xmm3,%xmm2
- .byte 102,15,111,131,213,60,0,0 // movdqa 0x3cd5(%ebx),%xmm0
- .byte 102,15,127,69,184 // movdqa %xmm0,-0x48(%ebp)
- .byte 102,15,239,240 // pxor %xmm0,%xmm6
- .byte 102,15,111,131,229,60,0,0 // movdqa 0x3ce5(%ebx),%xmm0
- .byte 102,15,111,216 // movdqa %xmm0,%xmm3
- .byte 102,15,102,222 // pcmpgtd %xmm6,%xmm3
- .byte 102,15,223,223 // pandn %xmm7,%xmm3
- .byte 102,15,111,125,152 // movdqa -0x68(%ebp),%xmm7
- .byte 102,15,239,125,184 // pxor -0x48(%ebp),%xmm7
- .byte 102,15,111,240 // movdqa %xmm0,%xmm6
- .byte 102,15,102,247 // pcmpgtd %xmm7,%xmm6
- .byte 102,15,223,245 // pandn %xmm5,%xmm6
- .byte 102,15,111,125,168 // movdqa -0x58(%ebp),%xmm7
- .byte 102,15,239,125,184 // pxor -0x48(%ebp),%xmm7
- .byte 102,15,111,232 // movdqa %xmm0,%xmm5
- .byte 102,15,102,239 // pcmpgtd %xmm7,%xmm5
- .byte 102,15,223,236 // pandn %xmm4,%xmm5
- .byte 102,15,239,77,184 // pxor -0x48(%ebp),%xmm1
- .byte 102,15,102,193 // pcmpgtd %xmm1,%xmm0
- .byte 102,15,223,194 // pandn %xmm2,%xmm0
+ .byte 102,15,111,194 // movdqa %xmm2,%xmm0
+ .byte 102,15,114,240,13 // pslld $0xd,%xmm0
+ .byte 102,15,235,195 // por %xmm3,%xmm0
+ .byte 102,15,254,197 // paddd %xmm5,%xmm0
+ .byte 102,15,239,212 // pxor %xmm4,%xmm2
+ .byte 102,15,102,242 // pcmpgtd %xmm2,%xmm6
+ .byte 102,15,223,240 // pandn %xmm0,%xmm6
+ .byte 102,15,127,113,64 // movdqa %xmm6,0x40(%ecx)
.byte 141,80,8 // lea 0x8(%eax),%edx
- .byte 137,124,36,16 // mov %edi,0x10(%esp)
- .byte 137,76,36,12 // mov %ecx,0xc(%esp)
- .byte 137,116,36,8 // mov %esi,0x8(%esp)
- .byte 137,84,36,4 // mov %edx,0x4(%esp)
- .byte 139,77,8 // mov 0x8(%ebp),%ecx
- .byte 137,12,36 // mov %ecx,(%esp)
- .byte 102,15,127,68,36,80 // movdqa %xmm0,0x50(%esp)
- .byte 102,15,127,108,36,64 // movdqa %xmm5,0x40(%esp)
- .byte 102,15,127,116,36,48 // movdqa %xmm6,0x30(%esp)
- .byte 102,15,127,92,36,32 // movdqa %xmm3,0x20(%esp)
- .byte 15,40,69,136 // movaps -0x78(%ebp),%xmm0
- .byte 15,40,141,120,255,255,255 // movaps -0x88(%ebp),%xmm1
- .byte 15,40,149,104,255,255,255 // movaps -0x98(%ebp),%xmm2
- .byte 15,40,157,88,255,255,255 // movaps -0xa8(%ebp),%xmm3
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 15,40,69,152 // movaps -0x68(%ebp),%xmm0
+ .byte 15,40,77,136 // movaps -0x78(%ebp),%xmm1
+ .byte 15,40,149,120,255,255,255 // movaps -0x88(%ebp),%xmm2
+ .byte 15,40,157,104,255,255,255 // movaps -0x98(%ebp),%xmm3
+ .byte 82 // push %edx
+ .byte 81 // push %ecx
.byte 255,80,4 // call *0x4(%eax)
- .byte 129,196,252,0,0,0 // add $0xfc,%esp
+ .byte 129,196,156,0,0,0 // add $0x9c,%esp
.byte 94 // pop %esi
.byte 95 // pop %edi
.byte 91 // pop %ebx
.byte 93 // pop %ebp
.byte 195 // ret
- .byte 242,15,16,12,242 // movsd (%edx,%esi,8),%xmm1
- .byte 102,15,239,192 // pxor %xmm0,%xmm0
- .byte 131,255,1 // cmp $0x1,%edi
- .byte 15,132,16,254,255,255 // je 6418 <_sk_load_f16_dst_sse2+0x59>
- .byte 102,15,22,76,242,8 // movhpd 0x8(%edx,%esi,8),%xmm1
- .byte 131,255,3 // cmp $0x3,%edi
- .byte 15,130,1,254,255,255 // jb 6418 <_sk_load_f16_dst_sse2+0x59>
- .byte 243,15,126,68,242,16 // movq 0x10(%edx,%esi,8),%xmm0
- .byte 233,246,253,255,255 // jmp 6418 <_sk_load_f16_dst_sse2+0x59>
+ .byte 242,15,16,4,254 // movsd (%esi,%edi,8),%xmm0
+ .byte 102,15,239,201 // pxor %xmm1,%xmm1
+ .byte 131,251,1 // cmp $0x1,%ebx
+ .byte 15,132,43,254,255,255 // je 4e28 <_sk_load_f16_dst_sse2+0x55>
+ .byte 102,15,22,68,254,8 // movhpd 0x8(%esi,%edi,8),%xmm0
+ .byte 131,251,3 // cmp $0x3,%ebx
+ .byte 15,130,28,254,255,255 // jb 4e28 <_sk_load_f16_dst_sse2+0x55>
+ .byte 243,15,126,76,254,16 // movq 0x10(%esi,%edi,8),%xmm1
+ .byte 233,17,254,255,255 // jmp 4e28 <_sk_load_f16_dst_sse2+0x55>
HIDDEN _sk_gather_f16_sse2
.globl _sk_gather_f16_sse2
@@ -56763,17 +55233,12 @@ FUNCTION(_sk_gather_f16_sse2)
_sk_gather_f16_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 129,236,204,0,0,0 // sub $0xcc,%esp
- .byte 232,0,0,0,0 // call 6633 <_sk_gather_f16_sse2+0x11>
- .byte 89 // pop %ecx
+ .byte 131,236,88 // sub $0x58,%esp
.byte 139,69,12 // mov 0xc(%ebp),%eax
- .byte 139,48 // mov (%eax),%esi
- .byte 139,22 // mov (%esi),%edx
+ .byte 139,16 // mov (%eax),%edx
+ .byte 139,10 // mov (%edx),%ecx
.byte 243,15,91,201 // cvttps2dq %xmm1,%xmm1
- .byte 102,15,110,86,4 // movd 0x4(%esi),%xmm2
+ .byte 102,15,110,82,4 // movd 0x4(%edx),%xmm2
.byte 102,15,112,210,0 // pshufd $0x0,%xmm2,%xmm2
.byte 102,15,112,217,245 // pshufd $0xf5,%xmm1,%xmm3
.byte 102,15,244,218 // pmuludq %xmm2,%xmm3
@@ -56783,138 +55248,120 @@ _sk_gather_f16_sse2:
.byte 102,15,98,203 // punpckldq %xmm3,%xmm1
.byte 243,15,91,192 // cvttps2dq %xmm0,%xmm0
.byte 102,15,254,193 // paddd %xmm1,%xmm0
- .byte 102,15,126,198 // movd %xmm0,%esi
- .byte 102,15,112,200,229 // pshufd $0xe5,%xmm0,%xmm1
- .byte 102,15,112,208,78 // pshufd $0x4e,%xmm0,%xmm2
- .byte 102,15,112,192,231 // pshufd $0xe7,%xmm0,%xmm0
- .byte 102,15,126,199 // movd %xmm0,%edi
- .byte 102,15,110,68,250,4 // movd 0x4(%edx,%edi,8),%xmm0
- .byte 102,15,110,28,250 // movd (%edx,%edi,8),%xmm3
- .byte 102,15,126,215 // movd %xmm2,%edi
- .byte 102,15,110,84,250,4 // movd 0x4(%edx,%edi,8),%xmm2
- .byte 102,15,110,36,250 // movd (%edx,%edi,8),%xmm4
- .byte 102,15,126,207 // movd %xmm1,%edi
- .byte 102,15,98,208 // punpckldq %xmm0,%xmm2
- .byte 102,15,98,227 // punpckldq %xmm3,%xmm4
- .byte 102,15,98,226 // punpckldq %xmm2,%xmm4
- .byte 102,15,110,68,242,4 // movd 0x4(%edx,%esi,8),%xmm0
- .byte 102,15,110,76,250,4 // movd 0x4(%edx,%edi,8),%xmm1
- .byte 102,15,98,193 // punpckldq %xmm1,%xmm0
- .byte 102,15,110,12,242 // movd (%edx,%esi,8),%xmm1
- .byte 102,15,110,20,250 // movd (%edx,%edi,8),%xmm2
+ .byte 102,15,112,200,78 // pshufd $0x4e,%xmm0,%xmm1
+ .byte 102,15,112,208,231 // pshufd $0xe7,%xmm0,%xmm2
+ .byte 102,15,126,210 // movd %xmm2,%edx
+ .byte 102,15,110,84,209,4 // movd 0x4(%ecx,%edx,8),%xmm2
+ .byte 102,15,110,28,209 // movd (%ecx,%edx,8),%xmm3
+ .byte 102,15,126,202 // movd %xmm1,%edx
+ .byte 102,15,110,76,209,4 // movd 0x4(%ecx,%edx,8),%xmm1
+ .byte 102,15,110,36,209 // movd (%ecx,%edx,8),%xmm4
+ .byte 102,15,126,194 // movd %xmm0,%edx
+ .byte 102,15,112,192,229 // pshufd $0xe5,%xmm0,%xmm0
+ .byte 102,15,110,108,209,4 // movd 0x4(%ecx,%edx,8),%xmm5
+ .byte 102,15,110,52,209 // movd (%ecx,%edx,8),%xmm6
+ .byte 102,15,126,194 // movd %xmm0,%edx
+ .byte 102,15,110,68,209,4 // movd 0x4(%ecx,%edx,8),%xmm0
+ .byte 102,15,110,60,209 // movd (%ecx,%edx,8),%xmm7
+ .byte 232,0,0,0,0 // call 50a5 <_sk_gather_f16_sse2+0x8e>
+ .byte 89 // pop %ecx
.byte 102,15,98,202 // punpckldq %xmm2,%xmm1
- .byte 102,15,98,200 // punpckldq %xmm0,%xmm1
- .byte 102,15,111,193 // movdqa %xmm1,%xmm0
+ .byte 102,15,98,227 // punpckldq %xmm3,%xmm4
+ .byte 102,15,98,225 // punpckldq %xmm1,%xmm4
+ .byte 102,15,98,232 // punpckldq %xmm0,%xmm5
+ .byte 102,15,98,247 // punpckldq %xmm7,%xmm6
+ .byte 102,15,98,245 // punpckldq %xmm5,%xmm6
+ .byte 102,15,111,198 // movdqa %xmm6,%xmm0
.byte 102,15,97,196 // punpcklwd %xmm4,%xmm0
- .byte 102,15,105,204 // punpckhwd %xmm4,%xmm1
+ .byte 102,15,105,244 // punpckhwd %xmm4,%xmm6
.byte 102,15,111,208 // movdqa %xmm0,%xmm2
- .byte 102,15,97,209 // punpcklwd %xmm1,%xmm2
- .byte 102,15,105,193 // punpckhwd %xmm1,%xmm0
- .byte 102,15,126,85,208 // movd %xmm2,-0x30(%ebp)
+ .byte 102,15,97,214 // punpcklwd %xmm6,%xmm2
+ .byte 102,15,105,198 // punpckhwd %xmm6,%xmm0
+ .byte 102,15,126,85,224 // movd %xmm2,-0x20(%ebp)
.byte 102,15,112,202,229 // pshufd $0xe5,%xmm2,%xmm1
- .byte 102,15,126,77,212 // movd %xmm1,-0x2c(%ebp)
- .byte 243,15,126,101,208 // movq -0x30(%ebp),%xmm4
+ .byte 102,15,126,77,228 // movd %xmm1,-0x1c(%ebp)
+ .byte 243,15,126,77,224 // movq -0x20(%ebp),%xmm1
.byte 102,15,112,218,231 // pshufd $0xe7,%xmm2,%xmm3
- .byte 102,15,126,93,220 // movd %xmm3,-0x24(%ebp)
+ .byte 102,15,126,93,236 // movd %xmm3,-0x14(%ebp)
.byte 102,15,112,210,78 // pshufd $0x4e,%xmm2,%xmm2
- .byte 102,15,126,85,216 // movd %xmm2,-0x28(%ebp)
- .byte 243,15,126,85,216 // movq -0x28(%ebp),%xmm2
- .byte 102,15,126,69,224 // movd %xmm0,-0x20(%ebp)
+ .byte 102,15,126,85,232 // movd %xmm2,-0x18(%ebp)
+ .byte 243,15,126,125,232 // movq -0x18(%ebp),%xmm7
+ .byte 102,15,126,69,240 // movd %xmm0,-0x10(%ebp)
.byte 102,15,112,216,229 // pshufd $0xe5,%xmm0,%xmm3
- .byte 102,15,126,93,228 // movd %xmm3,-0x1c(%ebp)
- .byte 243,15,126,77,224 // movq -0x20(%ebp),%xmm1
+ .byte 102,15,126,93,244 // movd %xmm3,-0xc(%ebp)
+ .byte 243,15,126,109,240 // movq -0x10(%ebp),%xmm5
.byte 102,15,112,216,231 // pshufd $0xe7,%xmm0,%xmm3
- .byte 102,15,126,93,236 // movd %xmm3,-0x14(%ebp)
+ .byte 102,15,126,93,252 // movd %xmm3,-0x4(%ebp)
.byte 102,15,112,192,78 // pshufd $0x4e,%xmm0,%xmm0
- .byte 102,15,126,69,232 // movd %xmm0,-0x18(%ebp)
- .byte 102,15,239,219 // pxor %xmm3,%xmm3
- .byte 102,15,111,236 // movdqa %xmm4,%xmm5
- .byte 102,15,97,235 // punpcklwd %xmm3,%xmm5
- .byte 102,15,111,161,173,58,0,0 // movdqa 0x3aad(%ecx),%xmm4
- .byte 102,15,111,197 // movdqa %xmm5,%xmm0
- .byte 102,15,219,196 // pand %xmm4,%xmm0
- .byte 102,15,239,232 // pxor %xmm0,%xmm5
- .byte 102,15,127,109,136 // movdqa %xmm5,-0x78(%ebp)
- .byte 102,15,114,240,16 // pslld $0x10,%xmm0
- .byte 102,15,114,245,13 // pslld $0xd,%xmm5
- .byte 102,15,235,232 // por %xmm0,%xmm5
- .byte 102,15,97,211 // punpcklwd %xmm3,%xmm2
- .byte 102,15,111,194 // movdqa %xmm2,%xmm0
- .byte 102,15,219,196 // pand %xmm4,%xmm0
- .byte 102,15,239,208 // pxor %xmm0,%xmm2
- .byte 102,15,127,85,152 // movdqa %xmm2,-0x68(%ebp)
- .byte 102,15,114,240,16 // pslld $0x10,%xmm0
- .byte 102,15,111,242 // movdqa %xmm2,%xmm6
- .byte 102,15,114,246,13 // pslld $0xd,%xmm6
- .byte 102,15,235,240 // por %xmm0,%xmm6
- .byte 102,15,97,203 // punpcklwd %xmm3,%xmm1
- .byte 102,15,111,193 // movdqa %xmm1,%xmm0
- .byte 102,15,219,196 // pand %xmm4,%xmm0
- .byte 102,15,239,200 // pxor %xmm0,%xmm1
- .byte 102,15,127,77,168 // movdqa %xmm1,-0x58(%ebp)
- .byte 102,15,114,240,16 // pslld $0x10,%xmm0
- .byte 102,15,111,249 // movdqa %xmm1,%xmm7
- .byte 102,15,114,247,13 // pslld $0xd,%xmm7
- .byte 102,15,235,248 // por %xmm0,%xmm7
- .byte 243,15,126,69,232 // movq -0x18(%ebp),%xmm0
- .byte 102,15,97,195 // punpcklwd %xmm3,%xmm0
- .byte 102,15,219,224 // pand %xmm0,%xmm4
- .byte 102,15,239,196 // pxor %xmm4,%xmm0
+ .byte 102,15,126,69,248 // movd %xmm0,-0x8(%ebp)
+ .byte 102,15,239,192 // pxor %xmm0,%xmm0
+ .byte 102,15,97,200 // punpcklwd %xmm0,%xmm1
+ .byte 102,15,111,153,75,45,0,0 // movdqa 0x2d4b(%ecx),%xmm3
+ .byte 102,15,111,225 // movdqa %xmm1,%xmm4
+ .byte 102,15,219,227 // pand %xmm3,%xmm4
+ .byte 102,15,239,204 // pxor %xmm4,%xmm1
.byte 102,15,114,244,16 // pslld $0x10,%xmm4
- .byte 102,15,111,200 // movdqa %xmm0,%xmm1
- .byte 102,15,114,241,13 // pslld $0xd,%xmm1
- .byte 102,15,235,204 // por %xmm4,%xmm1
- .byte 102,15,111,153,189,58,0,0 // movdqa 0x3abd(%ecx),%xmm3
- .byte 102,15,254,235 // paddd %xmm3,%xmm5
+ .byte 102,15,111,209 // movdqa %xmm1,%xmm2
+ .byte 102,15,114,242,13 // pslld $0xd,%xmm2
+ .byte 102,15,235,212 // por %xmm4,%xmm2
+ .byte 102,15,97,248 // punpcklwd %xmm0,%xmm7
+ .byte 102,15,111,231 // movdqa %xmm7,%xmm4
+ .byte 102,15,219,227 // pand %xmm3,%xmm4
+ .byte 102,15,239,252 // pxor %xmm4,%xmm7
+ .byte 102,15,127,125,168 // movdqa %xmm7,-0x58(%ebp)
+ .byte 102,15,114,244,16 // pslld $0x10,%xmm4
+ .byte 102,15,111,247 // movdqa %xmm7,%xmm6
+ .byte 102,15,114,246,13 // pslld $0xd,%xmm6
+ .byte 102,15,235,244 // por %xmm4,%xmm6
+ .byte 102,15,97,232 // punpcklwd %xmm0,%xmm5
+ .byte 102,15,111,253 // movdqa %xmm5,%xmm7
+ .byte 102,15,219,251 // pand %xmm3,%xmm7
+ .byte 102,15,239,239 // pxor %xmm7,%xmm5
+ .byte 102,15,127,109,184 // movdqa %xmm5,-0x48(%ebp)
+ .byte 102,15,114,247,16 // pslld $0x10,%xmm7
+ .byte 102,15,114,245,13 // pslld $0xd,%xmm5
+ .byte 102,15,235,239 // por %xmm7,%xmm5
+ .byte 243,15,126,125,248 // movq -0x8(%ebp),%xmm7
+ .byte 102,15,97,248 // punpcklwd %xmm0,%xmm7
+ .byte 102,15,219,223 // pand %xmm7,%xmm3
+ .byte 102,15,239,251 // pxor %xmm3,%xmm7
+ .byte 102,15,114,243,16 // pslld $0x10,%xmm3
+ .byte 102,15,111,199 // movdqa %xmm7,%xmm0
+ .byte 102,15,114,240,13 // pslld $0xd,%xmm0
+ .byte 102,15,235,195 // por %xmm3,%xmm0
+ .byte 102,15,111,153,91,45,0,0 // movdqa 0x2d5b(%ecx),%xmm3
+ .byte 102,15,254,211 // paddd %xmm3,%xmm2
.byte 102,15,254,243 // paddd %xmm3,%xmm6
- .byte 102,15,254,251 // paddd %xmm3,%xmm7
- .byte 102,15,254,203 // paddd %xmm3,%xmm1
- .byte 102,15,111,153,205,58,0,0 // movdqa 0x3acd(%ecx),%xmm3
- .byte 102,15,127,93,184 // movdqa %xmm3,-0x48(%ebp)
- .byte 102,15,111,85,136 // movdqa -0x78(%ebp),%xmm2
- .byte 102,15,239,211 // pxor %xmm3,%xmm2
- .byte 102,15,111,153,221,58,0,0 // movdqa 0x3add(%ecx),%xmm3
+ .byte 102,15,254,235 // paddd %xmm3,%xmm5
+ .byte 102,15,254,195 // paddd %xmm3,%xmm0
+ .byte 102,15,111,153,107,45,0,0 // movdqa 0x2d6b(%ecx),%xmm3
+ .byte 102,15,127,93,200 // movdqa %xmm3,-0x38(%ebp)
+ .byte 102,15,239,203 // pxor %xmm3,%xmm1
+ .byte 102,15,111,153,123,45,0,0 // movdqa 0x2d7b(%ecx),%xmm3
.byte 102,15,111,227 // movdqa %xmm3,%xmm4
- .byte 102,15,102,226 // pcmpgtd %xmm2,%xmm4
- .byte 102,15,223,229 // pandn %xmm5,%xmm4
- .byte 102,15,111,85,152 // movdqa -0x68(%ebp),%xmm2
- .byte 102,15,239,85,184 // pxor -0x48(%ebp),%xmm2
- .byte 102,15,111,235 // movdqa %xmm3,%xmm5
- .byte 102,15,102,234 // pcmpgtd %xmm2,%xmm5
- .byte 102,15,223,238 // pandn %xmm6,%xmm5
- .byte 102,15,111,117,168 // movdqa -0x58(%ebp),%xmm6
- .byte 102,15,239,117,184 // pxor -0x48(%ebp),%xmm6
+ .byte 102,15,102,225 // pcmpgtd %xmm1,%xmm4
+ .byte 102,15,223,226 // pandn %xmm2,%xmm4
+ .byte 102,15,111,85,168 // movdqa -0x58(%ebp),%xmm2
+ .byte 102,15,239,85,200 // pxor -0x38(%ebp),%xmm2
+ .byte 102,15,111,203 // movdqa %xmm3,%xmm1
+ .byte 102,15,102,202 // pcmpgtd %xmm2,%xmm1
+ .byte 102,15,223,206 // pandn %xmm6,%xmm1
+ .byte 102,15,111,117,184 // movdqa -0x48(%ebp),%xmm6
+ .byte 102,15,239,117,200 // pxor -0x38(%ebp),%xmm6
.byte 102,15,111,211 // movdqa %xmm3,%xmm2
.byte 102,15,102,214 // pcmpgtd %xmm6,%xmm2
+ .byte 102,15,223,213 // pandn %xmm5,%xmm2
+ .byte 102,15,239,125,200 // pxor -0x38(%ebp),%xmm7
+ .byte 102,15,102,223 // pcmpgtd %xmm7,%xmm3
+ .byte 102,15,223,216 // pandn %xmm0,%xmm3
.byte 139,77,8 // mov 0x8(%ebp),%ecx
- .byte 139,85,16 // mov 0x10(%ebp),%edx
- .byte 139,117,20 // mov 0x14(%ebp),%esi
- .byte 139,125,24 // mov 0x18(%ebp),%edi
- .byte 102,15,223,215 // pandn %xmm7,%xmm2
- .byte 15,40,117,40 // movaps 0x28(%ebp),%xmm6
- .byte 102,15,239,69,184 // pxor -0x48(%ebp),%xmm0
- .byte 15,40,125,56 // movaps 0x38(%ebp),%xmm7
- .byte 102,15,102,216 // pcmpgtd %xmm0,%xmm3
- .byte 15,40,69,72 // movaps 0x48(%ebp),%xmm0
- .byte 102,15,223,217 // pandn %xmm1,%xmm3
- .byte 15,40,77,88 // movaps 0x58(%ebp),%xmm1
- .byte 141,88,8 // lea 0x8(%eax),%ebx
- .byte 15,41,76,36,80 // movaps %xmm1,0x50(%esp)
- .byte 15,41,68,36,64 // movaps %xmm0,0x40(%esp)
- .byte 15,41,124,36,48 // movaps %xmm7,0x30(%esp)
- .byte 15,41,116,36,32 // movaps %xmm6,0x20(%esp)
- .byte 137,124,36,16 // mov %edi,0x10(%esp)
- .byte 137,116,36,12 // mov %esi,0xc(%esp)
- .byte 137,84,36,8 // mov %edx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,12,36 // mov %ecx,(%esp)
+ .byte 141,80,8 // lea 0x8(%eax),%edx
+ .byte 131,236,8 // sub $0x8,%esp
.byte 102,15,111,196 // movdqa %xmm4,%xmm0
- .byte 102,15,111,205 // movdqa %xmm5,%xmm1
+ .byte 82 // push %edx
+ .byte 81 // push %ecx
.byte 255,80,4 // call *0x4(%eax)
- .byte 129,196,204,0,0,0 // add $0xcc,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 131,196,104 // add $0x68,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -56924,35 +55371,34 @@ FUNCTION(_sk_store_f16_sse2)
_sk_store_f16_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
.byte 87 // push %edi
.byte 86 // push %esi
- .byte 129,236,188,0,0,0 // sub $0xbc,%esp
- .byte 15,41,93,200 // movaps %xmm3,-0x38(%ebp)
+ .byte 131,236,80 // sub $0x50,%esp
+ .byte 15,41,93,216 // movaps %xmm3,-0x28(%ebp)
.byte 102,15,111,218 // movdqa %xmm2,%xmm3
- .byte 232,0,0,0,0 // call 68d0 <_sk_store_f16_sse2+0x19>
+ .byte 232,0,0,0,0 // call 5268 <_sk_store_f16_sse2+0x15>
.byte 88 // pop %eax
- .byte 102,15,111,176,80,56,0,0 // movdqa 0x3850(%eax),%xmm6
+ .byte 102,15,111,176,200,43,0,0 // movdqa 0x2bc8(%eax),%xmm6
.byte 102,15,111,208 // movdqa %xmm0,%xmm2
.byte 102,15,219,214 // pand %xmm6,%xmm2
- .byte 102,15,127,69,184 // movdqa %xmm0,-0x48(%ebp)
+ .byte 102,15,127,69,200 // movdqa %xmm0,-0x38(%ebp)
.byte 102,15,111,232 // movdqa %xmm0,%xmm5
.byte 102,15,239,234 // pxor %xmm2,%xmm5
- .byte 102,15,111,160,96,56,0,0 // movdqa 0x3860(%eax),%xmm4
+ .byte 102,15,111,160,216,43,0,0 // movdqa 0x2bd8(%eax),%xmm4
.byte 102,15,114,210,16 // psrld $0x10,%xmm2
.byte 102,15,111,196 // movdqa %xmm4,%xmm0
.byte 102,15,102,197 // pcmpgtd %xmm5,%xmm0
.byte 102,15,114,213,13 // psrld $0xd,%xmm5
- .byte 102,15,111,184,112,56,0,0 // movdqa 0x3870(%eax),%xmm7
+ .byte 102,15,111,184,232,43,0,0 // movdqa 0x2be8(%eax),%xmm7
.byte 102,15,254,215 // paddd %xmm7,%xmm2
- .byte 102,15,127,125,216 // movdqa %xmm7,-0x28(%ebp)
+ .byte 102,15,127,125,232 // movdqa %xmm7,-0x18(%ebp)
.byte 102,15,254,213 // paddd %xmm5,%xmm2
.byte 102,15,114,242,16 // pslld $0x10,%xmm2
.byte 102,15,114,226,16 // psrad $0x10,%xmm2
.byte 102,15,223,194 // pandn %xmm2,%xmm0
.byte 102,15,111,233 // movdqa %xmm1,%xmm5
.byte 102,15,219,238 // pand %xmm6,%xmm5
- .byte 102,15,127,77,168 // movdqa %xmm1,-0x58(%ebp)
+ .byte 102,15,127,77,184 // movdqa %xmm1,-0x48(%ebp)
.byte 102,15,239,205 // pxor %xmm5,%xmm1
.byte 102,15,114,213,16 // psrld $0x10,%xmm5
.byte 102,15,111,212 // movdqa %xmm4,%xmm2
@@ -56965,15 +55411,15 @@ _sk_store_f16_sse2:
.byte 102,15,223,213 // pandn %xmm5,%xmm2
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,219,206 // pand %xmm6,%xmm1
- .byte 102,15,127,93,152 // movdqa %xmm3,-0x68(%ebp)
+ .byte 102,15,127,93,168 // movdqa %xmm3,-0x58(%ebp)
.byte 102,15,239,217 // pxor %xmm1,%xmm3
.byte 102,15,114,209,16 // psrld $0x10,%xmm1
.byte 102,15,111,236 // movdqa %xmm4,%xmm5
.byte 102,15,102,235 // pcmpgtd %xmm3,%xmm5
.byte 102,15,114,211,13 // psrld $0xd,%xmm3
- .byte 102,15,254,77,216 // paddd -0x28(%ebp),%xmm1
+ .byte 102,15,254,77,232 // paddd -0x18(%ebp),%xmm1
.byte 102,15,254,203 // paddd %xmm3,%xmm1
- .byte 102,15,111,93,200 // movdqa -0x38(%ebp),%xmm3
+ .byte 102,15,111,93,216 // movdqa -0x28(%ebp),%xmm3
.byte 102,15,114,241,16 // pslld $0x10,%xmm1
.byte 102,15,114,225,16 // psrad $0x10,%xmm1
.byte 102,15,223,233 // pandn %xmm1,%xmm5
@@ -56981,69 +55427,60 @@ _sk_store_f16_sse2:
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,239,206 // pxor %xmm6,%xmm1
.byte 102,15,114,214,16 // psrld $0x10,%xmm6
- .byte 102,15,254,117,216 // paddd -0x28(%ebp),%xmm6
+ .byte 102,15,254,117,232 // paddd -0x18(%ebp),%xmm6
.byte 102,15,102,225 // pcmpgtd %xmm1,%xmm4
.byte 102,15,114,209,13 // psrld $0xd,%xmm1
.byte 102,15,254,241 // paddd %xmm1,%xmm6
+ .byte 102,15,111,200 // movdqa %xmm0,%xmm1
.byte 102,15,114,246,16 // pslld $0x10,%xmm6
.byte 102,15,114,230,16 // psrad $0x10,%xmm6
.byte 102,15,223,230 // pandn %xmm6,%xmm4
- .byte 102,15,107,192 // packssdw %xmm0,%xmm0
+ .byte 102,15,107,201 // packssdw %xmm1,%xmm1
.byte 102,15,107,210 // packssdw %xmm2,%xmm2
- .byte 102,15,97,194 // punpcklwd %xmm2,%xmm0
- .byte 15,40,85,88 // movaps 0x58(%ebp),%xmm2
+ .byte 102,15,97,202 // punpcklwd %xmm2,%xmm1
.byte 102,15,107,237 // packssdw %xmm5,%xmm5
.byte 102,15,107,228 // packssdw %xmm4,%xmm4
.byte 102,15,97,236 // punpcklwd %xmm4,%xmm5
- .byte 15,40,125,72 // movaps 0x48(%ebp),%xmm7
- .byte 139,85,24 // mov 0x18(%ebp),%edx
- .byte 139,77,20 // mov 0x14(%ebp),%ecx
.byte 139,69,12 // mov 0xc(%ebp),%eax
- .byte 139,48 // mov (%eax),%esi
- .byte 139,94,4 // mov 0x4(%esi),%ebx
- .byte 15,175,217 // imul %ecx,%ebx
- .byte 193,227,3 // shl $0x3,%ebx
- .byte 3,30 // add (%esi),%ebx
- .byte 139,125,16 // mov 0x10(%ebp),%edi
- .byte 133,210 // test %edx,%edx
- .byte 139,117,8 // mov 0x8(%ebp),%esi
- .byte 15,40,117,56 // movaps 0x38(%ebp),%xmm6
- .byte 15,40,101,40 // movaps 0x28(%ebp),%xmm4
- .byte 102,15,111,200 // movdqa %xmm0,%xmm1
- .byte 102,15,98,205 // punpckldq %xmm5,%xmm1
- .byte 117,82 // jne 6a76 <_sk_store_f16_sse2+0x1bf>
- .byte 15,17,12,251 // movups %xmm1,(%ebx,%edi,8)
- .byte 102,15,106,197 // punpckhdq %xmm5,%xmm0
- .byte 243,15,127,68,251,16 // movdqu %xmm0,0x10(%ebx,%edi,8)
- .byte 141,88,8 // lea 0x8(%eax),%ebx
- .byte 15,41,84,36,80 // movaps %xmm2,0x50(%esp)
- .byte 15,41,124,36,64 // movaps %xmm7,0x40(%esp)
- .byte 15,41,116,36,48 // movaps %xmm6,0x30(%esp)
- .byte 15,41,100,36,32 // movaps %xmm4,0x20(%esp)
- .byte 137,84,36,16 // mov %edx,0x10(%esp)
- .byte 137,76,36,12 // mov %ecx,0xc(%esp)
- .byte 137,124,36,8 // mov %edi,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,52,36 // mov %esi,(%esp)
- .byte 15,40,69,184 // movaps -0x48(%ebp),%xmm0
- .byte 15,40,77,168 // movaps -0x58(%ebp),%xmm1
- .byte 15,40,85,152 // movaps -0x68(%ebp),%xmm2
+ .byte 139,77,8 // mov 0x8(%ebp),%ecx
+ .byte 139,17 // mov (%ecx),%edx
+ .byte 139,56 // mov (%eax),%edi
+ .byte 139,119,4 // mov 0x4(%edi),%esi
+ .byte 15,175,113,4 // imul 0x4(%ecx),%esi
+ .byte 193,230,3 // shl $0x3,%esi
+ .byte 3,55 // add (%edi),%esi
+ .byte 139,121,8 // mov 0x8(%ecx),%edi
+ .byte 133,255 // test %edi,%edi
+ .byte 117,53 // jne 53da <_sk_store_f16_sse2+0x187>
+ .byte 102,15,111,193 // movdqa %xmm1,%xmm0
+ .byte 102,15,98,197 // punpckldq %xmm5,%xmm0
+ .byte 243,15,127,4,214 // movdqu %xmm0,(%esi,%edx,8)
+ .byte 102,15,106,205 // punpckhdq %xmm5,%xmm1
+ .byte 243,15,127,76,214,16 // movdqu %xmm1,0x10(%esi,%edx,8)
+ .byte 141,80,8 // lea 0x8(%eax),%edx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 15,40,69,200 // movaps -0x38(%ebp),%xmm0
+ .byte 15,40,77,184 // movaps -0x48(%ebp),%xmm1
+ .byte 15,40,85,168 // movaps -0x58(%ebp),%xmm2
+ .byte 82 // push %edx
+ .byte 81 // push %ecx
.byte 255,80,4 // call *0x4(%eax)
- .byte 129,196,188,0,0,0 // add $0xbc,%esp
+ .byte 131,196,96 // add $0x60,%esp
.byte 94 // pop %esi
.byte 95 // pop %edi
- .byte 91 // pop %ebx
.byte 93 // pop %ebp
.byte 195 // ret
- .byte 102,15,214,12,251 // movq %xmm1,(%ebx,%edi,8)
- .byte 131,250,1 // cmp $0x1,%edx
- .byte 116,178 // je 6a32 <_sk_store_f16_sse2+0x17b>
- .byte 102,15,23,76,251,8 // movhpd %xmm1,0x8(%ebx,%edi,8)
- .byte 131,250,3 // cmp $0x3,%edx
- .byte 114,167 // jb 6a32 <_sk_store_f16_sse2+0x17b>
- .byte 102,15,106,197 // punpckhdq %xmm5,%xmm0
- .byte 102,15,214,68,251,16 // movq %xmm0,0x10(%ebx,%edi,8)
- .byte 235,155 // jmp 6a32 <_sk_store_f16_sse2+0x17b>
+ .byte 102,15,111,209 // movdqa %xmm1,%xmm2
+ .byte 102,15,98,213 // punpckldq %xmm5,%xmm2
+ .byte 102,15,214,20,214 // movq %xmm2,(%esi,%edx,8)
+ .byte 131,255,1 // cmp $0x1,%edi
+ .byte 116,208 // je 53bc <_sk_store_f16_sse2+0x169>
+ .byte 102,15,23,84,214,8 // movhpd %xmm2,0x8(%esi,%edx,8)
+ .byte 131,255,3 // cmp $0x3,%edi
+ .byte 114,197 // jb 53bc <_sk_store_f16_sse2+0x169>
+ .byte 102,15,106,205 // punpckhdq %xmm5,%xmm1
+ .byte 102,15,214,76,214,16 // movq %xmm1,0x10(%esi,%edx,8)
+ .byte 235,185 // jmp 53bc <_sk_store_f16_sse2+0x169>
HIDDEN _sk_load_u16_be_sse2
.globl _sk_load_u16_be_sse2
@@ -57054,23 +55491,23 @@ _sk_load_u16_be_sse2:
.byte 83 // push %ebx
.byte 87 // push %edi
.byte 86 // push %esi
- .byte 129,236,140,0,0,0 // sub $0x8c,%esp
- .byte 232,0,0,0,0 // call 6aa8 <_sk_load_u16_be_sse2+0x11>
- .byte 91 // pop %ebx
- .byte 15,40,125,88 // movaps 0x58(%ebp),%xmm7
+ .byte 131,236,44 // sub $0x2c,%esp
.byte 139,69,12 // mov 0xc(%ebp),%eax
- .byte 139,8 // mov (%eax),%ecx
- .byte 139,81,4 // mov 0x4(%ecx),%edx
- .byte 15,175,85,20 // imul 0x14(%ebp),%edx
- .byte 1,210 // add %edx,%edx
- .byte 3,17 // add (%ecx),%edx
- .byte 139,125,24 // mov 0x18(%ebp),%edi
- .byte 133,255 // test %edi,%edi
- .byte 139,117,16 // mov 0x10(%ebp),%esi
- .byte 141,12,181,0,0,0,0 // lea 0x0(,%esi,4),%ecx
- .byte 15,133,66,1,0,0 // jne 6c14 <_sk_load_u16_be_sse2+0x17d>
- .byte 102,15,16,4,74 // movupd (%edx,%ecx,2),%xmm0
- .byte 243,15,111,76,74,16 // movdqu 0x10(%edx,%ecx,2),%xmm1
+ .byte 139,77,8 // mov 0x8(%ebp),%ecx
+ .byte 139,49 // mov (%ecx),%esi
+ .byte 139,16 // mov (%eax),%edx
+ .byte 139,122,4 // mov 0x4(%edx),%edi
+ .byte 15,175,121,4 // imul 0x4(%ecx),%edi
+ .byte 1,255 // add %edi,%edi
+ .byte 3,58 // add (%edx),%edi
+ .byte 139,89,8 // mov 0x8(%ecx),%ebx
+ .byte 193,230,2 // shl $0x2,%esi
+ .byte 133,219 // test %ebx,%ebx
+ .byte 232,0,0,0,0 // call 542e <_sk_load_u16_be_sse2+0x2b>
+ .byte 90 // pop %edx
+ .byte 15,133,11,1,0,0 // jne 5540 <_sk_load_u16_be_sse2+0x13d>
+ .byte 102,15,16,4,119 // movupd (%edi,%esi,2),%xmm0
+ .byte 243,15,111,76,119,16 // movdqu 0x10(%edi,%esi,2),%xmm1
.byte 102,15,40,208 // movapd %xmm0,%xmm2
.byte 102,15,97,209 // punpcklwd %xmm1,%xmm2
.byte 102,15,105,193 // punpckhwd %xmm1,%xmm0
@@ -57089,7 +55526,7 @@ _sk_load_u16_be_sse2:
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 102,15,97,195 // punpcklwd %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,40,163,168,54,0,0 // movaps 0x36a8(%ebx),%xmm4
+ .byte 15,40,162,50,42,0,0 // movaps 0x2a32(%edx),%xmm4
.byte 15,89,196 // mulps %xmm4,%xmm0
.byte 102,15,111,205 // movdqa %xmm5,%xmm1
.byte 102,15,113,241,8 // psllw $0x8,%xmm1
@@ -57125,37 +55562,26 @@ _sk_load_u16_be_sse2:
.byte 102,15,97,235 // punpcklwd %xmm3,%xmm5
.byte 15,91,221 // cvtdq2ps %xmm5,%xmm3
.byte 15,89,220 // mulps %xmm4,%xmm3
- .byte 141,72,8 // lea 0x8(%eax),%ecx
- .byte 15,41,124,36,80 // movaps %xmm7,0x50(%esp)
- .byte 15,40,101,72 // movaps 0x48(%ebp),%xmm4
- .byte 15,41,100,36,64 // movaps %xmm4,0x40(%esp)
- .byte 15,40,101,56 // movaps 0x38(%ebp),%xmm4
- .byte 15,41,100,36,48 // movaps %xmm4,0x30(%esp)
- .byte 15,40,101,40 // movaps 0x28(%ebp),%xmm4
- .byte 15,41,100,36,32 // movaps %xmm4,0x20(%esp)
- .byte 137,124,36,16 // mov %edi,0x10(%esp)
- .byte 139,85,20 // mov 0x14(%ebp),%edx
- .byte 137,84,36,12 // mov %edx,0xc(%esp)
- .byte 137,116,36,8 // mov %esi,0x8(%esp)
- .byte 137,76,36,4 // mov %ecx,0x4(%esp)
- .byte 139,77,8 // mov 0x8(%ebp),%ecx
- .byte 137,12,36 // mov %ecx,(%esp)
+ .byte 141,80,8 // lea 0x8(%eax),%edx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 82 // push %edx
+ .byte 81 // push %ecx
.byte 255,80,4 // call *0x4(%eax)
- .byte 129,196,140,0,0,0 // add $0x8c,%esp
+ .byte 131,196,60 // add $0x3c,%esp
.byte 94 // pop %esi
.byte 95 // pop %edi
.byte 91 // pop %ebx
.byte 93 // pop %ebp
.byte 195 // ret
- .byte 242,15,16,4,74 // movsd (%edx,%ecx,2),%xmm0
+ .byte 242,15,16,4,119 // movsd (%edi,%esi,2),%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
- .byte 131,255,1 // cmp $0x1,%edi
- .byte 15,132,183,254,255,255 // je 6add <_sk_load_u16_be_sse2+0x46>
- .byte 102,15,22,68,74,8 // movhpd 0x8(%edx,%ecx,2),%xmm0
- .byte 131,255,3 // cmp $0x3,%edi
- .byte 15,130,168,254,255,255 // jb 6add <_sk_load_u16_be_sse2+0x46>
- .byte 243,15,126,76,74,16 // movq 0x10(%edx,%ecx,2),%xmm1
- .byte 233,157,254,255,255 // jmp 6add <_sk_load_u16_be_sse2+0x46>
+ .byte 131,251,1 // cmp $0x1,%ebx
+ .byte 15,132,238,254,255,255 // je 5440 <_sk_load_u16_be_sse2+0x3d>
+ .byte 102,15,22,68,119,8 // movhpd 0x8(%edi,%esi,2),%xmm0
+ .byte 131,251,3 // cmp $0x3,%ebx
+ .byte 15,130,223,254,255,255 // jb 5440 <_sk_load_u16_be_sse2+0x3d>
+ .byte 243,15,126,76,119,16 // movq 0x10(%edi,%esi,2),%xmm1
+ .byte 233,212,254,255,255 // jmp 5440 <_sk_load_u16_be_sse2+0x3d>
HIDDEN _sk_load_rgb_u16_be_sse2
.globl _sk_load_rgb_u16_be_sse2
@@ -57166,34 +55592,32 @@ _sk_load_rgb_u16_be_sse2:
.byte 83 // push %ebx
.byte 87 // push %edi
.byte 86 // push %esi
- .byte 131,236,124 // sub $0x7c,%esp
- .byte 232,0,0,0,0 // call 6c4e <_sk_load_rgb_u16_be_sse2+0xe>
- .byte 88 // pop %eax
- .byte 15,40,117,88 // movaps 0x58(%ebp),%xmm6
- .byte 15,40,109,72 // movaps 0x48(%ebp),%xmm5
- .byte 139,77,12 // mov 0xc(%ebp),%ecx
- .byte 139,17 // mov (%ecx),%edx
+ .byte 131,236,28 // sub $0x1c,%esp
+ .byte 139,69,12 // mov 0xc(%ebp),%eax
+ .byte 139,77,8 // mov 0x8(%ebp),%ecx
+ .byte 139,121,8 // mov 0x8(%ecx),%edi
+ .byte 139,16 // mov (%eax),%edx
.byte 139,114,4 // mov 0x4(%edx),%esi
- .byte 15,175,117,20 // imul 0x14(%ebp),%esi
+ .byte 15,175,113,4 // imul 0x4(%ecx),%esi
.byte 1,246 // add %esi,%esi
.byte 3,50 // add (%edx),%esi
- .byte 139,93,24 // mov 0x18(%ebp),%ebx
- .byte 133,219 // test %ebx,%ebx
- .byte 139,125,16 // mov 0x10(%ebp),%edi
- .byte 141,20,127 // lea (%edi,%edi,2),%edx
- .byte 15,133,32,1,0,0 // jne 6d98 <_sk_load_rgb_u16_be_sse2+0x158>
- .byte 243,15,111,20,86 // movdqu (%esi,%edx,2),%xmm2
- .byte 243,15,111,124,86,8 // movdqu 0x8(%esi,%edx,2),%xmm7
- .byte 102,15,115,223,4 // psrldq $0x4,%xmm7
+ .byte 107,25,3 // imul $0x3,(%ecx),%ebx
+ .byte 133,255 // test %edi,%edi
+ .byte 232,0,0,0,0 // call 5595 <_sk_load_rgb_u16_be_sse2+0x29>
+ .byte 90 // pop %edx
+ .byte 15,133,240,0,0,0 // jne 568c <_sk_load_rgb_u16_be_sse2+0x120>
+ .byte 243,15,111,20,94 // movdqu (%esi,%ebx,2),%xmm2
+ .byte 243,15,111,92,94,8 // movdqu 0x8(%esi,%ebx,2),%xmm3
+ .byte 102,15,115,219,4 // psrldq $0x4,%xmm3
.byte 102,15,111,194 // movdqa %xmm2,%xmm0
.byte 102,15,115,216,6 // psrldq $0x6,%xmm0
- .byte 102,15,111,207 // movdqa %xmm7,%xmm1
+ .byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,115,217,6 // psrldq $0x6,%xmm1
- .byte 102,15,97,215 // punpcklwd %xmm7,%xmm2
+ .byte 102,15,97,211 // punpcklwd %xmm3,%xmm2
.byte 102,15,97,193 // punpcklwd %xmm1,%xmm0
.byte 102,15,111,202 // movdqa %xmm2,%xmm1
.byte 102,15,97,200 // punpcklwd %xmm0,%xmm1
- .byte 102,15,112,217,78 // pshufd $0x4e,%xmm1,%xmm3
+ .byte 102,15,112,225,78 // pshufd $0x4e,%xmm1,%xmm4
.byte 102,15,105,208 // punpckhwd %xmm0,%xmm2
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
.byte 102,15,113,240,8 // psllw $0x8,%xmm0
@@ -57203,73 +55627,63 @@ _sk_load_rgb_u16_be_sse2:
.byte 102,15,112,193,229 // pshufd $0xe5,%xmm1,%xmm0
.byte 102,15,126,69,228 // movd %xmm0,-0x1c(%ebp)
.byte 243,15,126,69,224 // movq -0x20(%ebp),%xmm0
- .byte 102,15,239,255 // pxor %xmm7,%xmm7
- .byte 102,15,97,199 // punpcklwd %xmm7,%xmm0
+ .byte 102,15,239,219 // pxor %xmm3,%xmm3
+ .byte 102,15,97,195 // punpcklwd %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,40,160,18,53,0,0 // movaps 0x3512(%eax),%xmm4
- .byte 15,89,196 // mulps %xmm4,%xmm0
- .byte 102,15,111,203 // movdqa %xmm3,%xmm1
+ .byte 15,40,170,219,40,0,0 // movaps 0x28db(%edx),%xmm5
+ .byte 15,89,197 // mulps %xmm5,%xmm0
+ .byte 102,15,111,204 // movdqa %xmm4,%xmm1
.byte 102,15,113,241,8 // psllw $0x8,%xmm1
- .byte 102,15,113,211,8 // psrlw $0x8,%xmm3
- .byte 102,15,235,217 // por %xmm1,%xmm3
- .byte 102,15,126,93,216 // movd %xmm3,-0x28(%ebp)
- .byte 102,15,112,203,229 // pshufd $0xe5,%xmm3,%xmm1
+ .byte 102,15,113,212,8 // psrlw $0x8,%xmm4
+ .byte 102,15,235,225 // por %xmm1,%xmm4
+ .byte 102,15,126,101,216 // movd %xmm4,-0x28(%ebp)
+ .byte 102,15,112,204,229 // pshufd $0xe5,%xmm4,%xmm1
.byte 102,15,126,77,220 // movd %xmm1,-0x24(%ebp)
.byte 243,15,126,77,216 // movq -0x28(%ebp),%xmm1
- .byte 102,15,97,207 // punpcklwd %xmm7,%xmm1
+ .byte 102,15,97,203 // punpcklwd %xmm3,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,204 // mulps %xmm4,%xmm1
- .byte 102,15,111,218 // movdqa %xmm2,%xmm3
- .byte 102,15,113,243,8 // psllw $0x8,%xmm3
+ .byte 15,89,205 // mulps %xmm5,%xmm1
+ .byte 102,15,111,226 // movdqa %xmm2,%xmm4
+ .byte 102,15,113,244,8 // psllw $0x8,%xmm4
.byte 102,15,113,210,8 // psrlw $0x8,%xmm2
- .byte 102,15,235,211 // por %xmm3,%xmm2
+ .byte 102,15,235,212 // por %xmm4,%xmm2
.byte 102,15,126,85,232 // movd %xmm2,-0x18(%ebp)
.byte 102,15,112,210,229 // pshufd $0xe5,%xmm2,%xmm2
.byte 102,15,126,85,236 // movd %xmm2,-0x14(%ebp)
.byte 243,15,126,85,232 // movq -0x18(%ebp),%xmm2
- .byte 102,15,97,215 // punpcklwd %xmm7,%xmm2
+ .byte 102,15,97,211 // punpcklwd %xmm3,%xmm2
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,212 // mulps %xmm4,%xmm2
- .byte 141,81,8 // lea 0x8(%ecx),%edx
- .byte 15,41,116,36,80 // movaps %xmm6,0x50(%esp)
- .byte 15,41,108,36,64 // movaps %xmm5,0x40(%esp)
- .byte 15,40,93,56 // movaps 0x38(%ebp),%xmm3
- .byte 15,41,92,36,48 // movaps %xmm3,0x30(%esp)
- .byte 15,40,93,40 // movaps 0x28(%ebp),%xmm3
- .byte 15,41,92,36,32 // movaps %xmm3,0x20(%esp)
- .byte 137,92,36,16 // mov %ebx,0x10(%esp)
- .byte 139,117,20 // mov 0x14(%ebp),%esi
- .byte 137,116,36,12 // mov %esi,0xc(%esp)
- .byte 137,124,36,8 // mov %edi,0x8(%esp)
- .byte 137,84,36,4 // mov %edx,0x4(%esp)
- .byte 139,85,8 // mov 0x8(%ebp),%edx
- .byte 137,20,36 // mov %edx,(%esp)
- .byte 15,40,152,34,53,0,0 // movaps 0x3522(%eax),%xmm3
- .byte 255,81,4 // call *0x4(%ecx)
- .byte 131,196,124 // add $0x7c,%esp
+ .byte 15,89,213 // mulps %xmm5,%xmm2
+ .byte 141,112,8 // lea 0x8(%eax),%esi
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 15,40,154,235,40,0,0 // movaps 0x28eb(%edx),%xmm3
+ .byte 86 // push %esi
+ .byte 81 // push %ecx
+ .byte 255,80,4 // call *0x4(%eax)
+ .byte 131,196,44 // add $0x2c,%esp
.byte 94 // pop %esi
.byte 95 // pop %edi
.byte 91 // pop %ebx
.byte 93 // pop %ebp
.byte 195 // ret
- .byte 102,15,110,20,86 // movd (%esi,%edx,2),%xmm2
- .byte 102,15,196,84,86,4,2 // pinsrw $0x2,0x4(%esi,%edx,2),%xmm2
+ .byte 102,15,110,20,94 // movd (%esi,%ebx,2),%xmm2
+ .byte 102,15,196,84,94,4,2 // pinsrw $0x2,0x4(%esi,%ebx,2),%xmm2
.byte 102,15,239,201 // pxor %xmm1,%xmm1
- .byte 131,251,1 // cmp $0x1,%ebx
- .byte 117,13 // jne 6dba <_sk_load_rgb_u16_be_sse2+0x17a>
- .byte 102,15,239,255 // pxor %xmm7,%xmm7
+ .byte 131,255,1 // cmp $0x1,%edi
+ .byte 117,13 // jne 56ae <_sk_load_rgb_u16_be_sse2+0x142>
+ .byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 102,15,239,192 // pxor %xmm0,%xmm0
- .byte 233,224,254,255,255 // jmp 6c9a <_sk_load_rgb_u16_be_sse2+0x5a>
- .byte 102,15,110,68,86,6 // movd 0x6(%esi,%edx,2),%xmm0
- .byte 102,15,196,68,86,10,2 // pinsrw $0x2,0xa(%esi,%edx,2),%xmm0
+ .byte 233,16,255,255,255 // jmp 55be <_sk_load_rgb_u16_be_sse2+0x52>
+ .byte 102,15,110,68,94,6 // movd 0x6(%esi,%ebx,2),%xmm0
+ .byte 102,15,196,68,94,10,2 // pinsrw $0x2,0xa(%esi,%ebx,2),%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
- .byte 131,251,3 // cmp $0x3,%ebx
- .byte 114,18 // jb 6de2 <_sk_load_rgb_u16_be_sse2+0x1a2>
- .byte 102,15,110,124,86,12 // movd 0xc(%esi,%edx,2),%xmm7
- .byte 102,15,196,124,86,16,2 // pinsrw $0x2,0x10(%esi,%edx,2),%xmm7
- .byte 233,184,254,255,255 // jmp 6c9a <_sk_load_rgb_u16_be_sse2+0x5a>
- .byte 102,15,239,255 // pxor %xmm7,%xmm7
- .byte 233,175,254,255,255 // jmp 6c9a <_sk_load_rgb_u16_be_sse2+0x5a>
+ .byte 131,255,3 // cmp $0x3,%edi
+ .byte 114,18 // jb 56d6 <_sk_load_rgb_u16_be_sse2+0x16a>
+ .byte 102,15,110,92,94,12 // movd 0xc(%esi,%ebx,2),%xmm3
+ .byte 102,15,196,92,94,16,2 // pinsrw $0x2,0x10(%esi,%ebx,2),%xmm3
+ .byte 233,232,254,255,255 // jmp 55be <_sk_load_rgb_u16_be_sse2+0x52>
+ .byte 102,15,239,219 // pxor %xmm3,%xmm3
+ .byte 233,223,254,255,255 // jmp 55be <_sk_load_rgb_u16_be_sse2+0x52>
HIDDEN _sk_store_u16_be_sse2
.globl _sk_store_u16_be_sse2
@@ -57277,14 +55691,13 @@ FUNCTION(_sk_store_u16_be_sse2)
_sk_store_u16_be_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
.byte 87 // push %edi
.byte 86 // push %esi
- .byte 131,236,124 // sub $0x7c,%esp
- .byte 15,41,93,216 // movaps %xmm3,-0x28(%ebp)
- .byte 232,0,0,0,0 // call 6dfd <_sk_store_u16_be_sse2+0x12>
+ .byte 131,236,16 // sub $0x10,%esp
+ .byte 15,41,93,232 // movaps %xmm3,-0x18(%ebp)
+ .byte 232,0,0,0,0 // call 56f0 <_sk_store_u16_be_sse2+0x11>
.byte 88 // pop %eax
- .byte 15,40,176,131,51,0,0 // movaps 0x3383(%eax),%xmm6
+ .byte 15,40,176,160,39,0,0 // movaps 0x27a0(%eax),%xmm6
.byte 15,40,224 // movaps %xmm0,%xmm4
.byte 15,89,230 // mulps %xmm6,%xmm4
.byte 102,15,91,228 // cvtps2dq %xmm4,%xmm4
@@ -57315,7 +55728,7 @@ _sk_store_u16_be_sse2:
.byte 102,15,113,243,8 // psllw $0x8,%xmm3
.byte 102,15,113,213,8 // psrlw $0x8,%xmm5
.byte 102,15,235,235 // por %xmm3,%xmm5
- .byte 15,89,117,216 // mulps -0x28(%ebp),%xmm6
+ .byte 15,89,117,232 // mulps -0x18(%ebp),%xmm6
.byte 102,15,91,222 // cvtps2dq %xmm6,%xmm3
.byte 102,15,114,243,16 // pslld $0x10,%xmm3
.byte 102,15,114,227,16 // psrad $0x10,%xmm3
@@ -57326,55 +55739,45 @@ _sk_store_u16_be_sse2:
.byte 102,15,235,222 // por %xmm6,%xmm3
.byte 102,15,97,231 // punpcklwd %xmm7,%xmm4
.byte 102,15,97,235 // punpcklwd %xmm3,%xmm5
- .byte 139,85,24 // mov 0x18(%ebp),%edx
- .byte 139,77,20 // mov 0x14(%ebp),%ecx
.byte 139,69,12 // mov 0xc(%ebp),%eax
- .byte 139,48 // mov (%eax),%esi
- .byte 139,94,4 // mov 0x4(%esi),%ebx
- .byte 15,175,217 // imul %ecx,%ebx
- .byte 1,219 // add %ebx,%ebx
- .byte 3,30 // add (%esi),%ebx
- .byte 139,125,16 // mov 0x10(%ebp),%edi
- .byte 133,210 // test %edx,%edx
- .byte 141,52,189,0,0,0,0 // lea 0x0(,%edi,4),%esi
- .byte 15,40,125,56 // movaps 0x38(%ebp),%xmm7
- .byte 15,40,117,40 // movaps 0x28(%ebp),%xmm6
+ .byte 139,77,8 // mov 0x8(%ebp),%ecx
+ .byte 139,17 // mov (%ecx),%edx
+ .byte 139,56 // mov (%eax),%edi
+ .byte 139,119,4 // mov 0x4(%edi),%esi
+ .byte 15,175,113,4 // imul 0x4(%ecx),%esi
+ .byte 1,246 // add %esi,%esi
+ .byte 3,55 // add (%edi),%esi
+ .byte 139,121,8 // mov 0x8(%ecx),%edi
+ .byte 193,226,2 // shl $0x2,%edx
+ .byte 133,255 // test %edi,%edi
+ .byte 117,45 // jne 57f2 <_sk_store_u16_be_sse2+0x113>
.byte 102,15,111,220 // movdqa %xmm4,%xmm3
.byte 102,15,98,221 // punpckldq %xmm5,%xmm3
- .byte 117,82 // jne 6f38 <_sk_store_u16_be_sse2+0x14d>
- .byte 15,17,28,115 // movups %xmm3,(%ebx,%esi,2)
+ .byte 243,15,127,28,86 // movdqu %xmm3,(%esi,%edx,2)
.byte 102,15,106,229 // punpckhdq %xmm5,%xmm4
- .byte 243,15,127,100,115,16 // movdqu %xmm4,0x10(%ebx,%esi,2)
- .byte 141,112,8 // lea 0x8(%eax),%esi
- .byte 15,40,93,88 // movaps 0x58(%ebp),%xmm3
- .byte 15,41,92,36,80 // movaps %xmm3,0x50(%esp)
- .byte 15,40,93,72 // movaps 0x48(%ebp),%xmm3
- .byte 15,41,92,36,64 // movaps %xmm3,0x40(%esp)
- .byte 15,41,124,36,48 // movaps %xmm7,0x30(%esp)
- .byte 15,41,116,36,32 // movaps %xmm6,0x20(%esp)
- .byte 137,84,36,16 // mov %edx,0x10(%esp)
- .byte 137,76,36,12 // mov %ecx,0xc(%esp)
- .byte 137,124,36,8 // mov %edi,0x8(%esp)
- .byte 137,116,36,4 // mov %esi,0x4(%esp)
- .byte 139,77,8 // mov 0x8(%ebp),%ecx
- .byte 137,12,36 // mov %ecx,(%esp)
- .byte 15,40,93,216 // movaps -0x28(%ebp),%xmm3
+ .byte 243,15,127,100,86,16 // movdqu %xmm4,0x10(%esi,%edx,2)
+ .byte 141,80,8 // lea 0x8(%eax),%edx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 15,40,93,232 // movaps -0x18(%ebp),%xmm3
+ .byte 82 // push %edx
+ .byte 81 // push %ecx
.byte 255,80,4 // call *0x4(%eax)
- .byte 131,196,124 // add $0x7c,%esp
+ .byte 131,196,32 // add $0x20,%esp
.byte 94 // pop %esi
.byte 95 // pop %edi
- .byte 91 // pop %ebx
.byte 93 // pop %ebp
.byte 195 // ret
- .byte 102,15,214,28,115 // movq %xmm3,(%ebx,%esi,2)
- .byte 131,250,1 // cmp $0x1,%edx
- .byte 116,178 // je 6ef4 <_sk_store_u16_be_sse2+0x109>
- .byte 102,15,23,92,115,8 // movhpd %xmm3,0x8(%ebx,%esi,2)
- .byte 131,250,3 // cmp $0x3,%edx
- .byte 114,167 // jb 6ef4 <_sk_store_u16_be_sse2+0x109>
+ .byte 102,15,111,244 // movdqa %xmm4,%xmm6
+ .byte 102,15,98,245 // punpckldq %xmm5,%xmm6
+ .byte 102,15,214,52,86 // movq %xmm6,(%esi,%edx,2)
+ .byte 131,255,1 // cmp $0x1,%edi
+ .byte 116,216 // je 57dc <_sk_store_u16_be_sse2+0xfd>
+ .byte 102,15,23,116,86,8 // movhpd %xmm6,0x8(%esi,%edx,2)
+ .byte 131,255,3 // cmp $0x3,%edi
+ .byte 114,205 // jb 57dc <_sk_store_u16_be_sse2+0xfd>
.byte 102,15,106,229 // punpckhdq %xmm5,%xmm4
- .byte 102,15,214,100,115,16 // movq %xmm4,0x10(%ebx,%esi,2)
- .byte 235,155 // jmp 6ef4 <_sk_store_u16_be_sse2+0x109>
+ .byte 102,15,214,100,86,16 // movq %xmm4,0x10(%esi,%edx,2)
+ .byte 235,193 // jmp 57dc <_sk_store_u16_be_sse2+0xfd>
HIDDEN _sk_load_f32_sse2
.globl _sk_load_f32_sse2
@@ -57382,75 +55785,60 @@ FUNCTION(_sk_load_f32_sse2)
_sk_load_f32_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
.byte 87 // push %edi
.byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 15,40,125,88 // movaps 0x58(%ebp),%xmm7
- .byte 15,40,117,72 // movaps 0x48(%ebp),%xmm6
- .byte 139,85,20 // mov 0x14(%ebp),%edx
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
.byte 139,69,12 // mov 0xc(%ebp),%eax
+ .byte 139,77,8 // mov 0x8(%ebp),%ecx
+ .byte 139,57 // mov (%ecx),%edi
.byte 139,48 // mov (%eax),%esi
- .byte 139,94,4 // mov 0x4(%esi),%ebx
- .byte 15,175,218 // imul %edx,%ebx
- .byte 193,227,2 // shl $0x2,%ebx
- .byte 3,30 // add (%esi),%ebx
- .byte 137,206 // mov %ecx,%esi
- .byte 193,230,4 // shl $0x4,%esi
- .byte 15,16,44,30 // movups (%esi,%ebx,1),%xmm5
- .byte 139,125,24 // mov 0x18(%ebp),%edi
+ .byte 139,86,4 // mov 0x4(%esi),%edx
+ .byte 15,175,81,4 // imul 0x4(%ecx),%edx
+ .byte 193,226,2 // shl $0x2,%edx
+ .byte 3,22 // add (%esi),%edx
+ .byte 141,52,189,0,0,0,0 // lea 0x0(,%edi,4),%esi
+ .byte 193,231,4 // shl $0x4,%edi
+ .byte 15,16,36,23 // movups (%edi,%edx,1),%xmm4
+ .byte 139,121,8 // mov 0x8(%ecx),%edi
.byte 133,255 // test %edi,%edi
- .byte 141,52,141,0,0,0,0 // lea 0x0(,%ecx,4),%esi
- .byte 117,117 // jne 700c <_sk_load_f32_sse2+0xb3>
- .byte 15,16,84,179,16 // movups 0x10(%ebx,%esi,4),%xmm2
- .byte 15,16,92,179,32 // movups 0x20(%ebx,%esi,4),%xmm3
- .byte 15,16,68,179,48 // movups 0x30(%ebx,%esi,4),%xmm0
- .byte 15,40,229 // movaps %xmm5,%xmm4
- .byte 15,20,226 // unpcklps %xmm2,%xmm4
+ .byte 117,71 // jne 5892 <_sk_load_f32_sse2+0x77>
+ .byte 15,16,84,178,16 // movups 0x10(%edx,%esi,4),%xmm2
+ .byte 15,16,92,178,32 // movups 0x20(%edx,%esi,4),%xmm3
+ .byte 15,16,68,178,48 // movups 0x30(%edx,%esi,4),%xmm0
+ .byte 15,40,236 // movaps %xmm4,%xmm5
+ .byte 15,20,234 // unpcklps %xmm2,%xmm5
.byte 15,40,203 // movaps %xmm3,%xmm1
.byte 15,20,200 // unpcklps %xmm0,%xmm1
- .byte 15,21,234 // unpckhps %xmm2,%xmm5
+ .byte 15,21,226 // unpckhps %xmm2,%xmm4
.byte 15,21,216 // unpckhps %xmm0,%xmm3
- .byte 15,40,196 // movaps %xmm4,%xmm0
+ .byte 15,40,197 // movaps %xmm5,%xmm0
.byte 102,15,20,193 // unpcklpd %xmm1,%xmm0
- .byte 15,18,204 // movhlps %xmm4,%xmm1
- .byte 15,40,213 // movaps %xmm5,%xmm2
+ .byte 15,18,205 // movhlps %xmm5,%xmm1
+ .byte 15,40,212 // movaps %xmm4,%xmm2
.byte 102,15,20,211 // unpcklpd %xmm3,%xmm2
- .byte 15,18,221 // movhlps %xmm5,%xmm3
- .byte 141,112,8 // lea 0x8(%eax),%esi
- .byte 15,41,124,36,80 // movaps %xmm7,0x50(%esp)
- .byte 15,41,116,36,64 // movaps %xmm6,0x40(%esp)
- .byte 15,40,101,56 // movaps 0x38(%ebp),%xmm4
- .byte 15,41,100,36,48 // movaps %xmm4,0x30(%esp)
- .byte 15,40,101,40 // movaps 0x28(%ebp),%xmm4
- .byte 15,41,100,36,32 // movaps %xmm4,0x20(%esp)
- .byte 137,124,36,16 // mov %edi,0x10(%esp)
- .byte 137,84,36,12 // mov %edx,0xc(%esp)
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,116,36,4 // mov %esi,0x4(%esp)
- .byte 139,77,8 // mov 0x8(%ebp),%ecx
- .byte 137,12,36 // mov %ecx,(%esp)
+ .byte 15,18,220 // movhlps %xmm4,%xmm3
+ .byte 141,80,8 // lea 0x8(%eax),%edx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 82 // push %edx
+ .byte 81 // push %ecx
.byte 255,80,4 // call *0x4(%eax)
- .byte 131,196,108 // add $0x6c,%esp
+ .byte 131,196,16 // add $0x10,%esp
.byte 94 // pop %esi
.byte 95 // pop %edi
- .byte 91 // pop %ebx
.byte 93 // pop %ebp
.byte 195 // ret
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 131,255,1 // cmp $0x1,%edi
- .byte 117,8 // jne 701c <_sk_load_f32_sse2+0xc3>
+ .byte 117,8 // jne 58a2 <_sk_load_f32_sse2+0x87>
.byte 15,87,219 // xorps %xmm3,%xmm3
.byte 15,87,210 // xorps %xmm2,%xmm2
- .byte 235,138 // jmp 6fa6 <_sk_load_f32_sse2+0x4d>
- .byte 15,16,84,179,16 // movups 0x10(%ebx,%esi,4),%xmm2
+ .byte 235,184 // jmp 585a <_sk_load_f32_sse2+0x3f>
+ .byte 15,16,84,178,16 // movups 0x10(%edx,%esi,4),%xmm2
.byte 131,255,3 // cmp $0x3,%edi
- .byte 114,10 // jb 7030 <_sk_load_f32_sse2+0xd7>
- .byte 15,16,92,179,32 // movups 0x20(%ebx,%esi,4),%xmm3
- .byte 233,118,255,255,255 // jmp 6fa6 <_sk_load_f32_sse2+0x4d>
+ .byte 114,7 // jb 58b3 <_sk_load_f32_sse2+0x98>
+ .byte 15,16,92,178,32 // movups 0x20(%edx,%esi,4),%xmm3
+ .byte 235,167 // jmp 585a <_sk_load_f32_sse2+0x3f>
.byte 15,87,219 // xorps %xmm3,%xmm3
- .byte 233,110,255,255,255 // jmp 6fa6 <_sk_load_f32_sse2+0x4d>
+ .byte 235,162 // jmp 585a <_sk_load_f32_sse2+0x3f>
HIDDEN _sk_load_f32_dst_sse2
.globl _sk_load_f32_dst_sse2
@@ -57458,30 +55846,28 @@ FUNCTION(_sk_load_f32_dst_sse2)
_sk_load_f32_dst_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
.byte 87 // push %edi
.byte 86 // push %esi
- .byte 129,236,140,0,0,0 // sub $0x8c,%esp
- .byte 15,41,93,200 // movaps %xmm3,-0x38(%ebp)
- .byte 15,41,85,216 // movaps %xmm2,-0x28(%ebp)
- .byte 139,85,20 // mov 0x14(%ebp),%edx
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
+ .byte 131,236,32 // sub $0x20,%esp
+ .byte 15,41,93,216 // movaps %xmm3,-0x28(%ebp)
+ .byte 15,41,85,232 // movaps %xmm2,-0x18(%ebp)
.byte 139,69,12 // mov 0xc(%ebp),%eax
+ .byte 139,77,8 // mov 0x8(%ebp),%ecx
+ .byte 139,57 // mov (%ecx),%edi
.byte 139,48 // mov (%eax),%esi
- .byte 139,94,4 // mov 0x4(%esi),%ebx
- .byte 15,175,218 // imul %edx,%ebx
- .byte 193,227,2 // shl $0x2,%ebx
- .byte 3,30 // add (%esi),%ebx
- .byte 137,206 // mov %ecx,%esi
- .byte 193,230,4 // shl $0x4,%esi
- .byte 15,16,52,30 // movups (%esi,%ebx,1),%xmm6
- .byte 139,125,24 // mov 0x18(%ebp),%edi
+ .byte 139,86,4 // mov 0x4(%esi),%edx
+ .byte 15,175,81,4 // imul 0x4(%ecx),%edx
+ .byte 193,226,2 // shl $0x2,%edx
+ .byte 3,22 // add (%esi),%edx
+ .byte 141,52,189,0,0,0,0 // lea 0x0(,%edi,4),%esi
+ .byte 193,231,4 // shl $0x4,%edi
+ .byte 15,16,52,23 // movups (%edi,%edx,1),%xmm6
+ .byte 139,121,8 // mov 0x8(%ecx),%edi
.byte 133,255 // test %edi,%edi
- .byte 141,52,141,0,0,0,0 // lea 0x0(,%ecx,4),%esi
- .byte 117,122 // jne 70f3 <_sk_load_f32_dst_sse2+0xbb>
- .byte 15,16,124,179,16 // movups 0x10(%ebx,%esi,4),%xmm7
- .byte 15,16,92,179,32 // movups 0x20(%ebx,%esi,4),%xmm3
- .byte 15,16,84,179,48 // movups 0x30(%ebx,%esi,4),%xmm2
+ .byte 117,97 // jne 5954 <_sk_load_f32_dst_sse2+0x9c>
+ .byte 15,16,124,178,16 // movups 0x10(%edx,%esi,4),%xmm7
+ .byte 15,16,92,178,32 // movups 0x20(%edx,%esi,4),%xmm3
+ .byte 15,16,84,178,48 // movups 0x30(%edx,%esi,4),%xmm2
.byte 15,40,230 // movaps %xmm6,%xmm4
.byte 15,20,231 // unpcklps %xmm7,%xmm4
.byte 15,40,235 // movaps %xmm3,%xmm5
@@ -57494,39 +55880,35 @@ _sk_load_f32_dst_sse2:
.byte 15,40,230 // movaps %xmm6,%xmm4
.byte 102,15,20,227 // unpcklpd %xmm3,%xmm4
.byte 15,18,222 // movhlps %xmm6,%xmm3
- .byte 141,112,8 // lea 0x8(%eax),%esi
- .byte 137,124,36,16 // mov %edi,0x10(%esp)
- .byte 137,84,36,12 // mov %edx,0xc(%esp)
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,116,36,4 // mov %esi,0x4(%esp)
- .byte 139,77,8 // mov 0x8(%ebp),%ecx
- .byte 137,12,36 // mov %ecx,(%esp)
- .byte 15,41,92,36,80 // movaps %xmm3,0x50(%esp)
- .byte 102,15,41,100,36,64 // movapd %xmm4,0x40(%esp)
- .byte 15,41,108,36,48 // movaps %xmm5,0x30(%esp)
- .byte 102,15,41,84,36,32 // movapd %xmm2,0x20(%esp)
- .byte 15,40,85,216 // movaps -0x28(%ebp),%xmm2
- .byte 15,40,93,200 // movaps -0x38(%ebp),%xmm3
+ .byte 102,15,41,81,16 // movapd %xmm2,0x10(%ecx)
+ .byte 15,41,105,32 // movaps %xmm5,0x20(%ecx)
+ .byte 102,15,41,97,48 // movapd %xmm4,0x30(%ecx)
+ .byte 15,41,89,64 // movaps %xmm3,0x40(%ecx)
+ .byte 141,80,8 // lea 0x8(%eax),%edx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 15,40,85,232 // movaps -0x18(%ebp),%xmm2
+ .byte 15,40,93,216 // movaps -0x28(%ebp),%xmm3
+ .byte 82 // push %edx
+ .byte 81 // push %ecx
.byte 255,80,4 // call *0x4(%eax)
- .byte 129,196,140,0,0,0 // add $0x8c,%esp
+ .byte 131,196,48 // add $0x30,%esp
.byte 94 // pop %esi
.byte 95 // pop %edi
- .byte 91 // pop %ebx
.byte 93 // pop %ebp
.byte 195 // ret
.byte 15,87,210 // xorps %xmm2,%xmm2
.byte 131,255,1 // cmp $0x1,%edi
- .byte 117,8 // jne 7103 <_sk_load_f32_dst_sse2+0xcb>
+ .byte 117,8 // jne 5964 <_sk_load_f32_dst_sse2+0xac>
.byte 15,87,219 // xorps %xmm3,%xmm3
.byte 15,87,255 // xorps %xmm7,%xmm7
- .byte 235,133 // jmp 7088 <_sk_load_f32_dst_sse2+0x50>
- .byte 15,16,124,179,16 // movups 0x10(%ebx,%esi,4),%xmm7
+ .byte 235,158 // jmp 5902 <_sk_load_f32_dst_sse2+0x4a>
+ .byte 15,16,124,178,16 // movups 0x10(%edx,%esi,4),%xmm7
.byte 131,255,3 // cmp $0x3,%edi
- .byte 114,10 // jb 7117 <_sk_load_f32_dst_sse2+0xdf>
- .byte 15,16,92,179,32 // movups 0x20(%ebx,%esi,4),%xmm3
- .byte 233,113,255,255,255 // jmp 7088 <_sk_load_f32_dst_sse2+0x50>
+ .byte 114,7 // jb 5975 <_sk_load_f32_dst_sse2+0xbd>
+ .byte 15,16,92,178,32 // movups 0x20(%edx,%esi,4),%xmm3
+ .byte 235,141 // jmp 5902 <_sk_load_f32_dst_sse2+0x4a>
.byte 15,87,219 // xorps %xmm3,%xmm3
- .byte 233,105,255,255,255 // jmp 7088 <_sk_load_f32_dst_sse2+0x50>
+ .byte 235,136 // jmp 5902 <_sk_load_f32_dst_sse2+0x4a>
HIDDEN _sk_store_f32_sse2
.globl _sk_store_f32_sse2
@@ -57537,71 +55919,56 @@ _sk_store_f32_sse2:
.byte 83 // push %ebx
.byte 87 // push %edi
.byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 15,40,234 // movaps %xmm2,%xmm5
- .byte 15,40,248 // movaps %xmm0,%xmm7
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
+ .byte 131,236,12 // sub $0xc,%esp
.byte 139,69,12 // mov 0xc(%ebp),%eax
- .byte 139,16 // mov (%eax),%edx
- .byte 139,114,4 // mov 0x4(%edx),%esi
- .byte 15,175,117,20 // imul 0x14(%ebp),%esi
- .byte 193,230,2 // shl $0x2,%esi
- .byte 3,50 // add (%edx),%esi
- .byte 137,202 // mov %ecx,%edx
- .byte 193,226,4 // shl $0x4,%edx
- .byte 15,40,247 // movaps %xmm7,%xmm6
- .byte 15,20,241 // unpcklps %xmm1,%xmm6
- .byte 15,40,229 // movaps %xmm5,%xmm4
+ .byte 139,77,8 // mov 0x8(%ebp),%ecx
+ .byte 139,25 // mov (%ecx),%ebx
+ .byte 139,48 // mov (%eax),%esi
+ .byte 139,86,4 // mov 0x4(%esi),%edx
+ .byte 15,175,81,4 // imul 0x4(%ecx),%edx
+ .byte 193,226,2 // shl $0x2,%edx
+ .byte 3,22 // add (%esi),%edx
+ .byte 141,52,157,0,0,0,0 // lea 0x0(,%ebx,4),%esi
+ .byte 193,227,4 // shl $0x4,%ebx
+ .byte 15,40,232 // movaps %xmm0,%xmm5
+ .byte 15,20,233 // unpcklps %xmm1,%xmm5
+ .byte 15,40,226 // movaps %xmm2,%xmm4
.byte 15,20,227 // unpcklps %xmm3,%xmm4
- .byte 15,40,198 // movaps %xmm6,%xmm0
- .byte 102,15,20,196 // unpcklpd %xmm4,%xmm0
- .byte 102,15,17,4,50 // movupd %xmm0,(%edx,%esi,1)
- .byte 139,125,24 // mov 0x18(%ebp),%edi
- .byte 15,40,199 // movaps %xmm7,%xmm0
- .byte 15,21,193 // unpckhps %xmm1,%xmm0
- .byte 15,21,211 // unpckhps %xmm3,%xmm2
- .byte 15,18,230 // movhlps %xmm6,%xmm4
+ .byte 15,40,245 // movaps %xmm5,%xmm6
+ .byte 102,15,20,244 // unpcklpd %xmm4,%xmm6
+ .byte 139,121,8 // mov 0x8(%ecx),%edi
+ .byte 102,15,17,52,19 // movupd %xmm6,(%ebx,%edx,1)
.byte 15,40,240 // movaps %xmm0,%xmm6
- .byte 102,15,20,242 // unpcklpd %xmm2,%xmm6
+ .byte 15,21,241 // unpckhps %xmm1,%xmm6
+ .byte 15,40,250 // movaps %xmm2,%xmm7
+ .byte 15,21,251 // unpckhps %xmm3,%xmm7
+ .byte 15,18,229 // movhlps %xmm5,%xmm4
+ .byte 15,40,238 // movaps %xmm6,%xmm5
+ .byte 102,15,20,239 // unpcklpd %xmm7,%xmm5
.byte 133,255 // test %edi,%edi
- .byte 139,93,8 // mov 0x8(%ebp),%ebx
- .byte 141,20,141,0,0,0,0 // lea 0x0(,%ecx,4),%edx
- .byte 117,99 // jne 71e6 <_sk_store_f32_sse2+0xc7>
- .byte 102,15,21,194 // unpckhpd %xmm2,%xmm0
- .byte 15,17,100,150,16 // movups %xmm4,0x10(%esi,%edx,4)
- .byte 102,15,17,116,150,32 // movupd %xmm6,0x20(%esi,%edx,4)
- .byte 102,15,17,68,150,48 // movupd %xmm0,0x30(%esi,%edx,4)
+ .byte 117,40 // jne 5a00 <_sk_store_f32_sse2+0x86>
+ .byte 102,15,21,247 // unpckhpd %xmm7,%xmm6
+ .byte 15,17,100,178,16 // movups %xmm4,0x10(%edx,%esi,4)
+ .byte 102,15,17,108,178,32 // movupd %xmm5,0x20(%edx,%esi,4)
+ .byte 102,15,17,116,178,48 // movupd %xmm6,0x30(%edx,%esi,4)
.byte 141,80,8 // lea 0x8(%eax),%edx
- .byte 15,40,69,88 // movaps 0x58(%ebp),%xmm0
- .byte 15,41,68,36,80 // movaps %xmm0,0x50(%esp)
- .byte 15,40,69,72 // movaps 0x48(%ebp),%xmm0
- .byte 15,41,68,36,64 // movaps %xmm0,0x40(%esp)
- .byte 15,40,69,56 // movaps 0x38(%ebp),%xmm0
- .byte 15,41,68,36,48 // movaps %xmm0,0x30(%esp)
- .byte 15,40,69,40 // movaps 0x28(%ebp),%xmm0
- .byte 15,41,68,36,32 // movaps %xmm0,0x20(%esp)
- .byte 137,124,36,16 // mov %edi,0x10(%esp)
- .byte 139,117,20 // mov 0x14(%ebp),%esi
- .byte 137,116,36,12 // mov %esi,0xc(%esp)
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,84,36,4 // mov %edx,0x4(%esp)
- .byte 137,28,36 // mov %ebx,(%esp)
- .byte 15,40,199 // movaps %xmm7,%xmm0
- .byte 15,40,213 // movaps %xmm5,%xmm2
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 82 // push %edx
+ .byte 81 // push %ecx
.byte 255,80,4 // call *0x4(%eax)
- .byte 131,196,108 // add $0x6c,%esp
+ .byte 131,196,28 // add $0x1c,%esp
.byte 94 // pop %esi
.byte 95 // pop %edi
.byte 91 // pop %ebx
.byte 93 // pop %ebp
.byte 195 // ret
.byte 131,255,1 // cmp $0x1,%edi
- .byte 116,173 // je 7198 <_sk_store_f32_sse2+0x79>
- .byte 15,17,100,150,16 // movups %xmm4,0x10(%esi,%edx,4)
+ .byte 116,232 // je 59ed <_sk_store_f32_sse2+0x73>
+ .byte 15,17,100,178,16 // movups %xmm4,0x10(%edx,%esi,4)
.byte 131,255,3 // cmp $0x3,%edi
- .byte 114,163 // jb 7198 <_sk_store_f32_sse2+0x79>
- .byte 102,15,17,116,150,32 // movupd %xmm6,0x20(%esi,%edx,4)
- .byte 235,155 // jmp 7198 <_sk_store_f32_sse2+0x79>
+ .byte 114,222 // jb 59ed <_sk_store_f32_sse2+0x73>
+ .byte 102,15,17,108,178,32 // movupd %xmm5,0x20(%edx,%esi,4)
+ .byte 235,214 // jmp 59ed <_sk_store_f32_sse2+0x73>
HIDDEN _sk_clamp_x_sse2
.globl _sk_clamp_x_sse2
@@ -57609,43 +55976,23 @@ FUNCTION(_sk_clamp_x_sse2)
_sk_clamp_x_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
- .byte 139,85,20 // mov 0x14(%ebp),%edx
- .byte 139,117,12 // mov 0xc(%ebp),%esi
- .byte 139,62 // mov (%esi),%edi
- .byte 243,15,16,47 // movss (%edi),%xmm5
- .byte 139,125,24 // mov 0x18(%ebp),%edi
- .byte 15,40,117,40 // movaps 0x28(%ebp),%xmm6
- .byte 15,40,125,56 // movaps 0x38(%ebp),%xmm7
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 139,69,12 // mov 0xc(%ebp),%eax
+ .byte 139,8 // mov (%eax),%ecx
.byte 15,87,228 // xorps %xmm4,%xmm4
.byte 15,95,224 // maxps %xmm0,%xmm4
- .byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
- .byte 102,15,118,192 // pcmpeqd %xmm0,%xmm0
- .byte 102,15,254,197 // paddd %xmm5,%xmm0
- .byte 15,40,109,72 // movaps 0x48(%ebp),%xmm5
- .byte 15,93,224 // minps %xmm0,%xmm4
- .byte 15,40,69,88 // movaps 0x58(%ebp),%xmm0
- .byte 141,94,8 // lea 0x8(%esi),%ebx
- .byte 15,41,68,36,80 // movaps %xmm0,0x50(%esp)
- .byte 15,41,108,36,64 // movaps %xmm5,0x40(%esp)
- .byte 15,41,124,36,48 // movaps %xmm7,0x30(%esp)
- .byte 15,41,116,36,32 // movaps %xmm6,0x20(%esp)
- .byte 137,124,36,16 // mov %edi,0x10(%esp)
- .byte 137,84,36,12 // mov %edx,0xc(%esp)
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
+ .byte 243,15,16,1 // movss (%ecx),%xmm0
+ .byte 15,198,192,0 // shufps $0x0,%xmm0,%xmm0
+ .byte 102,15,118,237 // pcmpeqd %xmm5,%xmm5
+ .byte 102,15,254,232 // paddd %xmm0,%xmm5
+ .byte 15,93,229 // minps %xmm5,%xmm4
+ .byte 141,72,8 // lea 0x8(%eax),%ecx
+ .byte 131,236,8 // sub $0x8,%esp
.byte 15,40,196 // movaps %xmm4,%xmm0
- .byte 255,86,4 // call *0x4(%esi)
- .byte 131,196,108 // add $0x6c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 81 // push %ecx
+ .byte 255,117,8 // pushl 0x8(%ebp)
+ .byte 255,80,4 // call *0x4(%eax)
+ .byte 131,196,24 // add $0x18,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -57655,43 +56002,23 @@ FUNCTION(_sk_clamp_y_sse2)
_sk_clamp_y_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
- .byte 139,85,20 // mov 0x14(%ebp),%edx
- .byte 139,117,12 // mov 0xc(%ebp),%esi
- .byte 139,62 // mov (%esi),%edi
- .byte 243,15,16,47 // movss (%edi),%xmm5
- .byte 139,125,24 // mov 0x18(%ebp),%edi
- .byte 15,40,117,40 // movaps 0x28(%ebp),%xmm6
- .byte 15,40,125,56 // movaps 0x38(%ebp),%xmm7
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 139,69,12 // mov 0xc(%ebp),%eax
+ .byte 139,8 // mov (%eax),%ecx
.byte 15,87,228 // xorps %xmm4,%xmm4
.byte 15,95,225 // maxps %xmm1,%xmm4
- .byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
- .byte 102,15,118,201 // pcmpeqd %xmm1,%xmm1
- .byte 102,15,254,205 // paddd %xmm5,%xmm1
- .byte 15,40,109,72 // movaps 0x48(%ebp),%xmm5
- .byte 15,93,225 // minps %xmm1,%xmm4
- .byte 15,40,77,88 // movaps 0x58(%ebp),%xmm1
- .byte 141,94,8 // lea 0x8(%esi),%ebx
- .byte 15,41,76,36,80 // movaps %xmm1,0x50(%esp)
- .byte 15,41,108,36,64 // movaps %xmm5,0x40(%esp)
- .byte 15,41,124,36,48 // movaps %xmm7,0x30(%esp)
- .byte 15,41,116,36,32 // movaps %xmm6,0x20(%esp)
- .byte 137,124,36,16 // mov %edi,0x10(%esp)
- .byte 137,84,36,12 // mov %edx,0xc(%esp)
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
+ .byte 243,15,16,9 // movss (%ecx),%xmm1
+ .byte 15,198,201,0 // shufps $0x0,%xmm1,%xmm1
+ .byte 102,15,118,237 // pcmpeqd %xmm5,%xmm5
+ .byte 102,15,254,233 // paddd %xmm1,%xmm5
+ .byte 15,93,229 // minps %xmm5,%xmm4
+ .byte 141,72,8 // lea 0x8(%eax),%ecx
+ .byte 131,236,8 // sub $0x8,%esp
.byte 15,40,204 // movaps %xmm4,%xmm1
- .byte 255,86,4 // call *0x4(%esi)
- .byte 131,196,108 // add $0x6c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 81 // push %ecx
+ .byte 255,117,8 // pushl 0x8(%ebp)
+ .byte 255,80,4 // call *0x4(%eax)
+ .byte 131,196,24 // add $0x18,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -57701,52 +56028,32 @@ FUNCTION(_sk_repeat_x_sse2)
_sk_repeat_x_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 232,0,0,0,0 // call 7301 <_sk_repeat_x_sse2+0xe>
- .byte 94 // pop %esi
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
- .byte 139,85,12 // mov 0xc(%ebp),%edx
- .byte 139,58 // mov (%edx),%edi
- .byte 243,15,16,39 // movss (%edi),%xmm4
- .byte 243,15,16,111,4 // movss 0x4(%edi),%xmm5
- .byte 139,125,20 // mov 0x14(%ebp),%edi
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 232,0,0,0,0 // call 5a94 <_sk_repeat_x_sse2+0xb>
+ .byte 89 // pop %ecx
+ .byte 139,69,12 // mov 0xc(%ebp),%eax
+ .byte 139,16 // mov (%eax),%edx
+ .byte 243,15,16,34 // movss (%edx),%xmm4
+ .byte 243,15,16,106,4 // movss 0x4(%edx),%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
.byte 15,89,232 // mulps %xmm0,%xmm5
.byte 243,15,91,245 // cvttps2dq %xmm5,%xmm6
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
.byte 15,194,238,1 // cmpltps %xmm6,%xmm5
- .byte 15,84,174,143,46,0,0 // andps 0x2e8f(%esi),%xmm5
- .byte 139,117,24 // mov 0x18(%ebp),%esi
- .byte 15,40,125,40 // movaps 0x28(%ebp),%xmm7
+ .byte 15,84,169,12,36,0,0 // andps 0x240c(%ecx),%xmm5
.byte 15,92,245 // subps %xmm5,%xmm6
- .byte 15,40,109,56 // movaps 0x38(%ebp),%xmm5
.byte 15,198,228,0 // shufps $0x0,%xmm4,%xmm4
.byte 15,89,244 // mulps %xmm4,%xmm6
.byte 15,92,198 // subps %xmm6,%xmm0
- .byte 102,15,118,246 // pcmpeqd %xmm6,%xmm6
- .byte 102,15,254,244 // paddd %xmm4,%xmm6
- .byte 15,40,101,72 // movaps 0x48(%ebp),%xmm4
- .byte 15,93,198 // minps %xmm6,%xmm0
- .byte 15,40,117,88 // movaps 0x58(%ebp),%xmm6
- .byte 141,90,8 // lea 0x8(%edx),%ebx
- .byte 15,41,116,36,80 // movaps %xmm6,0x50(%esp)
- .byte 15,41,100,36,64 // movaps %xmm4,0x40(%esp)
- .byte 15,41,108,36,48 // movaps %xmm5,0x30(%esp)
- .byte 15,41,124,36,32 // movaps %xmm7,0x20(%esp)
- .byte 137,116,36,16 // mov %esi,0x10(%esp)
- .byte 137,124,36,12 // mov %edi,0xc(%esp)
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
- .byte 255,82,4 // call *0x4(%edx)
- .byte 131,196,108 // add $0x6c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 102,15,118,237 // pcmpeqd %xmm5,%xmm5
+ .byte 102,15,254,236 // paddd %xmm4,%xmm5
+ .byte 15,93,197 // minps %xmm5,%xmm0
+ .byte 141,72,8 // lea 0x8(%eax),%ecx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 81 // push %ecx
+ .byte 255,117,8 // pushl 0x8(%ebp)
+ .byte 255,80,4 // call *0x4(%eax)
+ .byte 131,196,24 // add $0x18,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -57756,52 +56063,32 @@ FUNCTION(_sk_repeat_y_sse2)
_sk_repeat_y_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 232,0,0,0,0 // call 73a0 <_sk_repeat_y_sse2+0xe>
- .byte 94 // pop %esi
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
- .byte 139,85,12 // mov 0xc(%ebp),%edx
- .byte 139,58 // mov (%edx),%edi
- .byte 243,15,16,39 // movss (%edi),%xmm4
- .byte 243,15,16,111,4 // movss 0x4(%edi),%xmm5
- .byte 139,125,20 // mov 0x14(%ebp),%edi
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 232,0,0,0,0 // call 5af1 <_sk_repeat_y_sse2+0xb>
+ .byte 89 // pop %ecx
+ .byte 139,69,12 // mov 0xc(%ebp),%eax
+ .byte 139,16 // mov (%eax),%edx
+ .byte 243,15,16,34 // movss (%edx),%xmm4
+ .byte 243,15,16,106,4 // movss 0x4(%edx),%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
.byte 15,89,233 // mulps %xmm1,%xmm5
.byte 243,15,91,245 // cvttps2dq %xmm5,%xmm6
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
.byte 15,194,238,1 // cmpltps %xmm6,%xmm5
- .byte 15,84,174,0,46,0,0 // andps 0x2e00(%esi),%xmm5
- .byte 139,117,24 // mov 0x18(%ebp),%esi
- .byte 15,40,125,40 // movaps 0x28(%ebp),%xmm7
+ .byte 15,84,169,191,35,0,0 // andps 0x23bf(%ecx),%xmm5
.byte 15,92,245 // subps %xmm5,%xmm6
- .byte 15,40,109,56 // movaps 0x38(%ebp),%xmm5
.byte 15,198,228,0 // shufps $0x0,%xmm4,%xmm4
.byte 15,89,244 // mulps %xmm4,%xmm6
.byte 15,92,206 // subps %xmm6,%xmm1
- .byte 102,15,118,246 // pcmpeqd %xmm6,%xmm6
- .byte 102,15,254,244 // paddd %xmm4,%xmm6
- .byte 15,40,101,72 // movaps 0x48(%ebp),%xmm4
- .byte 15,93,206 // minps %xmm6,%xmm1
- .byte 15,40,117,88 // movaps 0x58(%ebp),%xmm6
- .byte 141,90,8 // lea 0x8(%edx),%ebx
- .byte 15,41,116,36,80 // movaps %xmm6,0x50(%esp)
- .byte 15,41,100,36,64 // movaps %xmm4,0x40(%esp)
- .byte 15,41,108,36,48 // movaps %xmm5,0x30(%esp)
- .byte 15,41,124,36,32 // movaps %xmm7,0x20(%esp)
- .byte 137,116,36,16 // mov %esi,0x10(%esp)
- .byte 137,124,36,12 // mov %edi,0xc(%esp)
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
- .byte 255,82,4 // call *0x4(%edx)
- .byte 131,196,108 // add $0x6c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 102,15,118,237 // pcmpeqd %xmm5,%xmm5
+ .byte 102,15,254,236 // paddd %xmm4,%xmm5
+ .byte 15,93,205 // minps %xmm5,%xmm1
+ .byte 141,72,8 // lea 0x8(%eax),%ecx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 81 // push %ecx
+ .byte 255,117,8 // pushl 0x8(%ebp)
+ .byte 255,80,4 // call *0x4(%eax)
+ .byte 131,196,24 // add $0x18,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -57811,61 +56098,41 @@ FUNCTION(_sk_mirror_x_sse2)
_sk_mirror_x_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 232,0,0,0,0 // call 743f <_sk_mirror_x_sse2+0xe>
- .byte 95 // pop %edi
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
- .byte 139,85,12 // mov 0xc(%ebp),%edx
- .byte 139,50 // mov (%edx),%esi
- .byte 243,15,16,46 // movss (%esi),%xmm5
- .byte 243,15,16,118,4 // movss 0x4(%esi),%xmm6
- .byte 139,117,20 // mov 0x14(%ebp),%esi
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 232,0,0,0,0 // call 5b4e <_sk_mirror_x_sse2+0xb>
+ .byte 89 // pop %ecx
+ .byte 139,69,12 // mov 0xc(%ebp),%eax
+ .byte 139,16 // mov (%eax),%edx
+ .byte 243,15,16,42 // movss (%edx),%xmm5
+ .byte 243,15,16,114,4 // movss 0x4(%edx),%xmm6
.byte 15,40,229 // movaps %xmm5,%xmm4
.byte 15,198,228,0 // shufps $0x0,%xmm4,%xmm4
.byte 15,92,196 // subps %xmm4,%xmm0
- .byte 243,15,89,183,97,50,0,0 // mulss 0x3261(%edi),%xmm6
+ .byte 243,15,89,177,98,40,0,0 // mulss 0x2862(%ecx),%xmm6
.byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6
.byte 15,89,240 // mulps %xmm0,%xmm6
.byte 243,15,91,254 // cvttps2dq %xmm6,%xmm7
.byte 15,91,255 // cvtdq2ps %xmm7,%xmm7
.byte 15,194,247,1 // cmpltps %xmm7,%xmm6
- .byte 15,84,183,113,45,0,0 // andps 0x2d71(%edi),%xmm6
- .byte 139,125,24 // mov 0x18(%ebp),%edi
+ .byte 15,84,177,114,35,0,0 // andps 0x2372(%ecx),%xmm6
.byte 15,92,254 // subps %xmm6,%xmm7
- .byte 15,40,117,40 // movaps 0x28(%ebp),%xmm6
.byte 243,15,88,237 // addss %xmm5,%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
.byte 15,89,253 // mulps %xmm5,%xmm7
- .byte 15,40,109,56 // movaps 0x38(%ebp),%xmm5
.byte 15,92,199 // subps %xmm7,%xmm0
- .byte 15,87,255 // xorps %xmm7,%xmm7
+ .byte 15,87,237 // xorps %xmm5,%xmm5
.byte 15,92,196 // subps %xmm4,%xmm0
- .byte 15,92,248 // subps %xmm0,%xmm7
- .byte 15,84,199 // andps %xmm7,%xmm0
- .byte 102,15,118,255 // pcmpeqd %xmm7,%xmm7
- .byte 102,15,254,252 // paddd %xmm4,%xmm7
- .byte 15,40,101,72 // movaps 0x48(%ebp),%xmm4
- .byte 15,93,199 // minps %xmm7,%xmm0
- .byte 15,40,125,88 // movaps 0x58(%ebp),%xmm7
- .byte 141,90,8 // lea 0x8(%edx),%ebx
- .byte 15,41,124,36,80 // movaps %xmm7,0x50(%esp)
- .byte 15,41,100,36,64 // movaps %xmm4,0x40(%esp)
- .byte 15,41,108,36,48 // movaps %xmm5,0x30(%esp)
- .byte 15,41,116,36,32 // movaps %xmm6,0x20(%esp)
- .byte 137,124,36,16 // mov %edi,0x10(%esp)
- .byte 137,116,36,12 // mov %esi,0xc(%esp)
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
- .byte 255,82,4 // call *0x4(%edx)
- .byte 131,196,108 // add $0x6c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 15,92,232 // subps %xmm0,%xmm5
+ .byte 15,84,197 // andps %xmm5,%xmm0
+ .byte 102,15,118,237 // pcmpeqd %xmm5,%xmm5
+ .byte 102,15,254,236 // paddd %xmm4,%xmm5
+ .byte 15,93,197 // minps %xmm5,%xmm0
+ .byte 141,72,8 // lea 0x8(%eax),%ecx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 81 // push %ecx
+ .byte 255,117,8 // pushl 0x8(%ebp)
+ .byte 255,80,4 // call *0x4(%eax)
+ .byte 131,196,24 // add $0x18,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -57875,61 +56142,41 @@ FUNCTION(_sk_mirror_y_sse2)
_sk_mirror_y_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 232,0,0,0,0 // call 7500 <_sk_mirror_y_sse2+0xe>
- .byte 95 // pop %edi
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
- .byte 139,85,12 // mov 0xc(%ebp),%edx
- .byte 139,50 // mov (%edx),%esi
- .byte 243,15,16,46 // movss (%esi),%xmm5
- .byte 243,15,16,118,4 // movss 0x4(%esi),%xmm6
- .byte 139,117,20 // mov 0x14(%ebp),%esi
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 232,0,0,0,0 // call 5bcd <_sk_mirror_y_sse2+0xb>
+ .byte 89 // pop %ecx
+ .byte 139,69,12 // mov 0xc(%ebp),%eax
+ .byte 139,16 // mov (%eax),%edx
+ .byte 243,15,16,42 // movss (%edx),%xmm5
+ .byte 243,15,16,114,4 // movss 0x4(%edx),%xmm6
.byte 15,40,229 // movaps %xmm5,%xmm4
.byte 15,198,228,0 // shufps $0x0,%xmm4,%xmm4
.byte 15,92,204 // subps %xmm4,%xmm1
- .byte 243,15,89,183,164,49,0,0 // mulss 0x31a4(%edi),%xmm6
+ .byte 243,15,89,177,231,39,0,0 // mulss 0x27e7(%ecx),%xmm6
.byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6
.byte 15,89,241 // mulps %xmm1,%xmm6
.byte 243,15,91,254 // cvttps2dq %xmm6,%xmm7
.byte 15,91,255 // cvtdq2ps %xmm7,%xmm7
.byte 15,194,247,1 // cmpltps %xmm7,%xmm6
- .byte 15,84,183,192,44,0,0 // andps 0x2cc0(%edi),%xmm6
- .byte 139,125,24 // mov 0x18(%ebp),%edi
+ .byte 15,84,177,3,35,0,0 // andps 0x2303(%ecx),%xmm6
.byte 15,92,254 // subps %xmm6,%xmm7
- .byte 15,40,117,40 // movaps 0x28(%ebp),%xmm6
.byte 243,15,88,237 // addss %xmm5,%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
.byte 15,89,253 // mulps %xmm5,%xmm7
- .byte 15,40,109,56 // movaps 0x38(%ebp),%xmm5
.byte 15,92,207 // subps %xmm7,%xmm1
- .byte 15,87,255 // xorps %xmm7,%xmm7
+ .byte 15,87,237 // xorps %xmm5,%xmm5
.byte 15,92,204 // subps %xmm4,%xmm1
- .byte 15,92,249 // subps %xmm1,%xmm7
- .byte 15,84,207 // andps %xmm7,%xmm1
- .byte 102,15,118,255 // pcmpeqd %xmm7,%xmm7
- .byte 102,15,254,252 // paddd %xmm4,%xmm7
- .byte 15,40,101,72 // movaps 0x48(%ebp),%xmm4
- .byte 15,93,207 // minps %xmm7,%xmm1
- .byte 15,40,125,88 // movaps 0x58(%ebp),%xmm7
- .byte 141,90,8 // lea 0x8(%edx),%ebx
- .byte 15,41,124,36,80 // movaps %xmm7,0x50(%esp)
- .byte 15,41,100,36,64 // movaps %xmm4,0x40(%esp)
- .byte 15,41,108,36,48 // movaps %xmm5,0x30(%esp)
- .byte 15,41,116,36,32 // movaps %xmm6,0x20(%esp)
- .byte 137,124,36,16 // mov %edi,0x10(%esp)
- .byte 137,116,36,12 // mov %esi,0xc(%esp)
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
- .byte 255,82,4 // call *0x4(%edx)
- .byte 131,196,108 // add $0x6c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 15,92,233 // subps %xmm1,%xmm5
+ .byte 15,84,205 // andps %xmm5,%xmm1
+ .byte 102,15,118,237 // pcmpeqd %xmm5,%xmm5
+ .byte 102,15,254,236 // paddd %xmm4,%xmm5
+ .byte 15,93,205 // minps %xmm5,%xmm1
+ .byte 141,72,8 // lea 0x8(%eax),%ecx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 81 // push %ecx
+ .byte 255,117,8 // pushl 0x8(%ebp)
+ .byte 255,80,4 // call *0x4(%eax)
+ .byte 131,196,24 // add $0x18,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -57939,40 +56186,20 @@ FUNCTION(_sk_clamp_x_1_sse2)
_sk_clamp_x_1_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 232,0,0,0,0 // call 75c1 <_sk_clamp_x_1_sse2+0xe>
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 232,0,0,0,0 // call 5c4c <_sk_clamp_x_1_sse2+0xb>
.byte 88 // pop %eax
- .byte 139,77,8 // mov 0x8(%ebp),%ecx
- .byte 139,85,16 // mov 0x10(%ebp),%edx
- .byte 139,117,20 // mov 0x14(%ebp),%esi
- .byte 139,125,24 // mov 0x18(%ebp),%edi
- .byte 15,40,109,40 // movaps 0x28(%ebp),%xmm5
- .byte 15,40,117,56 // movaps 0x38(%ebp),%xmm6
- .byte 15,40,125,72 // movaps 0x48(%ebp),%xmm7
+ .byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 15,87,228 // xorps %xmm4,%xmm4
.byte 15,95,224 // maxps %xmm0,%xmm4
- .byte 15,40,69,88 // movaps 0x58(%ebp),%xmm0
- .byte 15,93,160,15,44,0,0 // minps 0x2c0f(%eax),%xmm4
- .byte 139,69,12 // mov 0xc(%ebp),%eax
- .byte 141,88,4 // lea 0x4(%eax),%ebx
- .byte 15,41,68,36,80 // movaps %xmm0,0x50(%esp)
- .byte 15,41,124,36,64 // movaps %xmm7,0x40(%esp)
- .byte 15,41,116,36,48 // movaps %xmm6,0x30(%esp)
- .byte 15,41,108,36,32 // movaps %xmm5,0x20(%esp)
- .byte 137,124,36,16 // mov %edi,0x10(%esp)
- .byte 137,116,36,12 // mov %esi,0xc(%esp)
- .byte 137,84,36,8 // mov %edx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,12,36 // mov %ecx,(%esp)
+ .byte 15,93,160,148,34,0,0 // minps 0x2294(%eax),%xmm4
+ .byte 141,65,4 // lea 0x4(%ecx),%eax
+ .byte 131,236,8 // sub $0x8,%esp
.byte 15,40,196 // movaps %xmm4,%xmm0
- .byte 255,16 // call *(%eax)
- .byte 131,196,108 // add $0x6c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 80 // push %eax
+ .byte 255,117,8 // pushl 0x8(%ebp)
+ .byte 255,17 // call *(%ecx)
+ .byte 131,196,24 // add $0x18,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -57982,43 +56209,23 @@ FUNCTION(_sk_repeat_x_1_sse2)
_sk_repeat_x_1_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 232,0,0,0,0 // call 7633 <_sk_repeat_x_1_sse2+0xe>
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 232,0,0,0,0 // call 5c7c <_sk_repeat_x_1_sse2+0xb>
.byte 88 // pop %eax
- .byte 139,77,8 // mov 0x8(%ebp),%ecx
- .byte 139,85,16 // mov 0x10(%ebp),%edx
- .byte 139,117,20 // mov 0x14(%ebp),%esi
- .byte 139,125,24 // mov 0x18(%ebp),%edi
- .byte 15,40,101,40 // movaps 0x28(%ebp),%xmm4
- .byte 15,40,109,56 // movaps 0x38(%ebp),%xmm5
- .byte 243,15,91,240 // cvttps2dq %xmm0,%xmm6
- .byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
- .byte 15,40,248 // movaps %xmm0,%xmm7
- .byte 15,194,254,1 // cmpltps %xmm6,%xmm7
- .byte 15,84,184,173,43,0,0 // andps 0x2bad(%eax),%xmm7
- .byte 15,92,247 // subps %xmm7,%xmm6
- .byte 15,40,125,72 // movaps 0x48(%ebp),%xmm7
- .byte 15,92,198 // subps %xmm6,%xmm0
- .byte 15,40,117,88 // movaps 0x58(%ebp),%xmm6
- .byte 139,69,12 // mov 0xc(%ebp),%eax
- .byte 141,88,4 // lea 0x4(%eax),%ebx
- .byte 15,41,116,36,80 // movaps %xmm6,0x50(%esp)
- .byte 15,41,124,36,64 // movaps %xmm7,0x40(%esp)
- .byte 15,41,108,36,48 // movaps %xmm5,0x30(%esp)
- .byte 15,41,100,36,32 // movaps %xmm4,0x20(%esp)
- .byte 137,124,36,16 // mov %edi,0x10(%esp)
- .byte 137,116,36,12 // mov %esi,0xc(%esp)
- .byte 137,84,36,8 // mov %edx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,12,36 // mov %ecx,(%esp)
- .byte 255,16 // call *(%eax)
- .byte 131,196,108 // add $0x6c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 139,77,12 // mov 0xc(%ebp),%ecx
+ .byte 243,15,91,224 // cvttps2dq %xmm0,%xmm4
+ .byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
+ .byte 15,40,232 // movaps %xmm0,%xmm5
+ .byte 15,194,236,1 // cmpltps %xmm4,%xmm5
+ .byte 15,84,168,116,34,0,0 // andps 0x2274(%eax),%xmm5
+ .byte 15,92,229 // subps %xmm5,%xmm4
+ .byte 15,92,196 // subps %xmm4,%xmm0
+ .byte 141,65,4 // lea 0x4(%ecx),%eax
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 80 // push %eax
+ .byte 255,117,8 // pushl 0x8(%ebp)
+ .byte 255,17 // call *(%ecx)
+ .byte 131,196,24 // add $0x18,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -58028,51 +56235,31 @@ FUNCTION(_sk_mirror_x_1_sse2)
_sk_mirror_x_1_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 232,0,0,0,0 // call 76b0 <_sk_mirror_x_1_sse2+0xe>
- .byte 95 // pop %edi
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
- .byte 139,85,20 // mov 0x14(%ebp),%edx
- .byte 139,117,24 // mov 0x18(%ebp),%esi
- .byte 15,40,101,40 // movaps 0x28(%ebp),%xmm4
- .byte 15,40,175,64,43,0,0 // movaps 0x2b40(%edi),%xmm5
- .byte 15,88,197 // addps %xmm5,%xmm0
- .byte 15,40,183,80,43,0,0 // movaps 0x2b50(%edi),%xmm6
- .byte 15,89,240 // mulps %xmm0,%xmm6
- .byte 243,15,91,254 // cvttps2dq %xmm6,%xmm7
- .byte 15,91,255 // cvtdq2ps %xmm7,%xmm7
- .byte 15,194,247,1 // cmpltps %xmm7,%xmm6
- .byte 15,84,183,96,43,0,0 // andps 0x2b60(%edi),%xmm6
- .byte 15,92,254 // subps %xmm6,%xmm7
- .byte 15,40,117,56 // movaps 0x38(%ebp),%xmm6
- .byte 15,88,255 // addps %xmm7,%xmm7
- .byte 15,92,199 // subps %xmm7,%xmm0
- .byte 15,40,125,72 // movaps 0x48(%ebp),%xmm7
- .byte 15,88,197 // addps %xmm5,%xmm0
- .byte 15,87,237 // xorps %xmm5,%xmm5
- .byte 15,92,232 // subps %xmm0,%xmm5
- .byte 15,84,197 // andps %xmm5,%xmm0
- .byte 15,40,109,88 // movaps 0x58(%ebp),%xmm5
- .byte 139,125,12 // mov 0xc(%ebp),%edi
- .byte 141,95,4 // lea 0x4(%edi),%ebx
- .byte 15,41,108,36,80 // movaps %xmm5,0x50(%esp)
- .byte 15,41,124,36,64 // movaps %xmm7,0x40(%esp)
- .byte 15,41,116,36,48 // movaps %xmm6,0x30(%esp)
- .byte 15,41,100,36,32 // movaps %xmm4,0x20(%esp)
- .byte 137,116,36,16 // mov %esi,0x10(%esp)
- .byte 137,84,36,12 // mov %edx,0xc(%esp)
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
- .byte 255,23 // call *(%edi)
- .byte 131,196,108 // add $0x6c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 232,0,0,0,0 // call 5cb7 <_sk_mirror_x_1_sse2+0xb>
+ .byte 89 // pop %ecx
+ .byte 139,69,12 // mov 0xc(%ebp),%eax
+ .byte 15,40,161,73,34,0,0 // movaps 0x2249(%ecx),%xmm4
+ .byte 15,88,196 // addps %xmm4,%xmm0
+ .byte 15,40,169,89,34,0,0 // movaps 0x2259(%ecx),%xmm5
+ .byte 15,89,232 // mulps %xmm0,%xmm5
+ .byte 243,15,91,245 // cvttps2dq %xmm5,%xmm6
+ .byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
+ .byte 15,194,238,1 // cmpltps %xmm6,%xmm5
+ .byte 15,84,169,105,34,0,0 // andps 0x2269(%ecx),%xmm5
+ .byte 15,87,255 // xorps %xmm7,%xmm7
+ .byte 15,92,245 // subps %xmm5,%xmm6
+ .byte 15,88,246 // addps %xmm6,%xmm6
+ .byte 15,92,198 // subps %xmm6,%xmm0
+ .byte 15,88,196 // addps %xmm4,%xmm0
+ .byte 15,92,248 // subps %xmm0,%xmm7
+ .byte 15,84,199 // andps %xmm7,%xmm0
+ .byte 141,72,4 // lea 0x4(%eax),%ecx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 81 // push %ecx
+ .byte 255,117,8 // pushl 0x8(%ebp)
+ .byte 255,16 // call *(%eax)
+ .byte 131,196,24 // add $0x18,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -58082,45 +56269,25 @@ FUNCTION(_sk_luminance_to_alpha_sse2)
_sk_luminance_to_alpha_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
+ .byte 131,236,8 // sub $0x8,%esp
.byte 15,40,218 // movaps %xmm2,%xmm3
- .byte 232,0,0,0,0 // call 7750 <_sk_luminance_to_alpha_sse2+0x11>
+ .byte 232,0,0,0,0 // call 5d15 <_sk_luminance_to_alpha_sse2+0xe>
.byte 88 // pop %eax
- .byte 139,77,8 // mov 0x8(%ebp),%ecx
- .byte 139,85,16 // mov 0x10(%ebp),%edx
- .byte 139,117,20 // mov 0x14(%ebp),%esi
- .byte 139,125,24 // mov 0x18(%ebp),%edi
- .byte 15,40,85,40 // movaps 0x28(%ebp),%xmm2
- .byte 15,40,101,56 // movaps 0x38(%ebp),%xmm4
- .byte 15,40,109,72 // movaps 0x48(%ebp),%xmm5
- .byte 15,40,117,88 // movaps 0x58(%ebp),%xmm6
- .byte 15,89,128,208,42,0,0 // mulps 0x2ad0(%eax),%xmm0
- .byte 15,89,136,224,42,0,0 // mulps 0x2ae0(%eax),%xmm1
- .byte 15,89,152,240,42,0,0 // mulps 0x2af0(%eax),%xmm3
- .byte 139,69,12 // mov 0xc(%ebp),%eax
+ .byte 139,77,12 // mov 0xc(%ebp),%ecx
+ .byte 15,89,128,27,34,0,0 // mulps 0x221b(%eax),%xmm0
+ .byte 15,89,136,43,34,0,0 // mulps 0x222b(%eax),%xmm1
.byte 15,88,200 // addps %xmm0,%xmm1
+ .byte 15,89,152,59,34,0,0 // mulps 0x223b(%eax),%xmm3
.byte 15,88,217 // addps %xmm1,%xmm3
- .byte 141,88,4 // lea 0x4(%eax),%ebx
- .byte 15,41,116,36,80 // movaps %xmm6,0x50(%esp)
- .byte 15,41,108,36,64 // movaps %xmm5,0x40(%esp)
- .byte 15,41,100,36,48 // movaps %xmm4,0x30(%esp)
- .byte 15,41,84,36,32 // movaps %xmm2,0x20(%esp)
- .byte 137,124,36,16 // mov %edi,0x10(%esp)
- .byte 137,116,36,12 // mov %esi,0xc(%esp)
- .byte 137,84,36,8 // mov %edx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,12,36 // mov %ecx,(%esp)
+ .byte 141,65,4 // lea 0x4(%ecx),%eax
+ .byte 131,236,8 // sub $0x8,%esp
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 15,87,201 // xorps %xmm1,%xmm1
.byte 15,87,210 // xorps %xmm2,%xmm2
- .byte 255,16 // call *(%eax)
- .byte 131,196,108 // add $0x6c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 80 // push %eax
+ .byte 255,117,8 // pushl 0x8(%ebp)
+ .byte 255,17 // call *(%ecx)
+ .byte 131,196,24 // add $0x18,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -58130,41 +56297,21 @@ FUNCTION(_sk_matrix_translate_sse2)
_sk_matrix_translate_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
- .byte 139,85,20 // mov 0x14(%ebp),%edx
- .byte 139,117,12 // mov 0xc(%ebp),%esi
- .byte 139,62 // mov (%esi),%edi
- .byte 243,15,16,39 // movss (%edi),%xmm4
- .byte 243,15,16,111,4 // movss 0x4(%edi),%xmm5
- .byte 139,125,24 // mov 0x18(%ebp),%edi
- .byte 15,40,117,40 // movaps 0x28(%ebp),%xmm6
- .byte 15,40,125,56 // movaps 0x38(%ebp),%xmm7
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 139,69,12 // mov 0xc(%ebp),%eax
+ .byte 139,8 // mov (%eax),%ecx
+ .byte 243,15,16,33 // movss (%ecx),%xmm4
+ .byte 243,15,16,105,4 // movss 0x4(%ecx),%xmm5
.byte 15,198,228,0 // shufps $0x0,%xmm4,%xmm4
.byte 15,88,196 // addps %xmm4,%xmm0
- .byte 15,40,101,72 // movaps 0x48(%ebp),%xmm4
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
.byte 15,88,205 // addps %xmm5,%xmm1
- .byte 15,40,109,88 // movaps 0x58(%ebp),%xmm5
- .byte 141,94,8 // lea 0x8(%esi),%ebx
- .byte 15,41,108,36,80 // movaps %xmm5,0x50(%esp)
- .byte 15,41,100,36,64 // movaps %xmm4,0x40(%esp)
- .byte 15,41,124,36,48 // movaps %xmm7,0x30(%esp)
- .byte 15,41,116,36,32 // movaps %xmm6,0x20(%esp)
- .byte 137,124,36,16 // mov %edi,0x10(%esp)
- .byte 137,84,36,12 // mov %edx,0xc(%esp)
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
- .byte 255,86,4 // call *0x4(%esi)
- .byte 131,196,108 // add $0x6c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 141,72,8 // lea 0x8(%eax),%ecx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 81 // push %ecx
+ .byte 255,117,8 // pushl 0x8(%ebp)
+ .byte 255,80,4 // call *0x4(%eax)
+ .byte 131,196,24 // add $0x18,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -58174,47 +56321,27 @@ FUNCTION(_sk_matrix_scale_translate_sse2)
_sk_matrix_scale_translate_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
- .byte 139,117,20 // mov 0x14(%ebp),%esi
- .byte 139,85,12 // mov 0xc(%ebp),%edx
- .byte 139,58 // mov (%edx),%edi
- .byte 243,15,16,103,8 // movss 0x8(%edi),%xmm4
- .byte 243,15,16,47 // movss (%edi),%xmm5
- .byte 243,15,16,119,4 // movss 0x4(%edi),%xmm6
- .byte 243,15,16,127,12 // movss 0xc(%edi),%xmm7
- .byte 139,125,24 // mov 0x18(%ebp),%edi
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 139,69,12 // mov 0xc(%ebp),%eax
+ .byte 139,8 // mov (%eax),%ecx
+ .byte 243,15,16,97,8 // movss 0x8(%ecx),%xmm4
.byte 15,198,228,0 // shufps $0x0,%xmm4,%xmm4
- .byte 15,89,196 // mulps %xmm4,%xmm0
- .byte 15,40,101,40 // movaps 0x28(%ebp),%xmm4
+ .byte 243,15,16,41 // movss (%ecx),%xmm5
+ .byte 243,15,16,113,4 // movss 0x4(%ecx),%xmm6
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
+ .byte 15,89,196 // mulps %xmm4,%xmm0
.byte 15,88,197 // addps %xmm5,%xmm0
- .byte 15,40,109,56 // movaps 0x38(%ebp),%xmm5
- .byte 15,198,255,0 // shufps $0x0,%xmm7,%xmm7
- .byte 15,89,207 // mulps %xmm7,%xmm1
- .byte 15,40,125,72 // movaps 0x48(%ebp),%xmm7
+ .byte 243,15,16,97,12 // movss 0xc(%ecx),%xmm4
+ .byte 15,198,228,0 // shufps $0x0,%xmm4,%xmm4
.byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6
+ .byte 15,89,204 // mulps %xmm4,%xmm1
.byte 15,88,206 // addps %xmm6,%xmm1
- .byte 15,40,117,88 // movaps 0x58(%ebp),%xmm6
- .byte 141,90,8 // lea 0x8(%edx),%ebx
- .byte 15,41,116,36,80 // movaps %xmm6,0x50(%esp)
- .byte 15,41,124,36,64 // movaps %xmm7,0x40(%esp)
- .byte 15,41,108,36,48 // movaps %xmm5,0x30(%esp)
- .byte 15,41,100,36,32 // movaps %xmm4,0x20(%esp)
- .byte 137,124,36,16 // mov %edi,0x10(%esp)
- .byte 137,116,36,12 // mov %esi,0xc(%esp)
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
- .byte 255,82,4 // call *0x4(%edx)
- .byte 131,196,108 // add $0x6c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 141,72,8 // lea 0x8(%eax),%ecx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 81 // push %ecx
+ .byte 255,117,8 // pushl 0x8(%ebp)
+ .byte 255,80,4 // call *0x4(%eax)
+ .byte 131,196,24 // add $0x18,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -58224,57 +56351,37 @@ FUNCTION(_sk_matrix_2x3_sse2)
_sk_matrix_2x3_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
+ .byte 131,236,8 // sub $0x8,%esp
.byte 15,40,233 // movaps %xmm1,%xmm5
.byte 15,40,224 // movaps %xmm0,%xmm4
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
- .byte 139,117,20 // mov 0x14(%ebp),%esi
- .byte 139,85,12 // mov 0xc(%ebp),%edx
- .byte 139,58 // mov (%edx),%edi
- .byte 243,15,16,7 // movss (%edi),%xmm0
- .byte 243,15,16,79,4 // movss 0x4(%edi),%xmm1
+ .byte 139,69,12 // mov 0xc(%ebp),%eax
+ .byte 139,8 // mov (%eax),%ecx
+ .byte 243,15,16,1 // movss (%ecx),%xmm0
+ .byte 243,15,16,73,4 // movss 0x4(%ecx),%xmm1
.byte 15,198,192,0 // shufps $0x0,%xmm0,%xmm0
- .byte 243,15,16,119,8 // movss 0x8(%edi),%xmm6
+ .byte 243,15,16,113,8 // movss 0x8(%ecx),%xmm6
.byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6
- .byte 243,15,16,127,16 // movss 0x10(%edi),%xmm7
+ .byte 243,15,16,121,16 // movss 0x10(%ecx),%xmm7
.byte 15,198,255,0 // shufps $0x0,%xmm7,%xmm7
.byte 15,89,245 // mulps %xmm5,%xmm6
.byte 15,88,247 // addps %xmm7,%xmm6
.byte 15,89,196 // mulps %xmm4,%xmm0
.byte 15,88,198 // addps %xmm6,%xmm0
- .byte 243,15,16,119,12 // movss 0xc(%edi),%xmm6
- .byte 243,15,16,127,20 // movss 0x14(%edi),%xmm7
- .byte 139,125,24 // mov 0x18(%ebp),%edi
+ .byte 15,198,201,0 // shufps $0x0,%xmm1,%xmm1
+ .byte 243,15,16,113,12 // movss 0xc(%ecx),%xmm6
.byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6
- .byte 15,89,245 // mulps %xmm5,%xmm6
- .byte 15,40,109,40 // movaps 0x28(%ebp),%xmm5
+ .byte 243,15,16,121,20 // movss 0x14(%ecx),%xmm7
.byte 15,198,255,0 // shufps $0x0,%xmm7,%xmm7
+ .byte 15,89,245 // mulps %xmm5,%xmm6
.byte 15,88,247 // addps %xmm7,%xmm6
- .byte 15,40,125,56 // movaps 0x38(%ebp),%xmm7
- .byte 15,198,201,0 // shufps $0x0,%xmm1,%xmm1
.byte 15,89,204 // mulps %xmm4,%xmm1
- .byte 15,40,101,72 // movaps 0x48(%ebp),%xmm4
.byte 15,88,206 // addps %xmm6,%xmm1
- .byte 15,40,117,88 // movaps 0x58(%ebp),%xmm6
- .byte 141,90,8 // lea 0x8(%edx),%ebx
- .byte 15,41,116,36,80 // movaps %xmm6,0x50(%esp)
- .byte 15,41,100,36,64 // movaps %xmm4,0x40(%esp)
- .byte 15,41,124,36,48 // movaps %xmm7,0x30(%esp)
- .byte 15,41,108,36,32 // movaps %xmm5,0x20(%esp)
- .byte 137,124,36,16 // mov %edi,0x10(%esp)
- .byte 137,116,36,12 // mov %esi,0xc(%esp)
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
- .byte 255,82,4 // call *0x4(%edx)
- .byte 131,196,108 // add $0x6c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 141,72,8 // lea 0x8(%eax),%ecx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 81 // push %ecx
+ .byte 255,117,8 // pushl 0x8(%ebp)
+ .byte 255,80,4 // call *0x4(%eax)
+ .byte 131,196,24 // add $0x18,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -58284,80 +56391,59 @@ FUNCTION(_sk_matrix_3x4_sse2)
_sk_matrix_3x4_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 15,40,225 // movaps %xmm1,%xmm4
- .byte 15,40,232 // movaps %xmm0,%xmm5
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
- .byte 139,117,20 // mov 0x14(%ebp),%esi
- .byte 139,85,12 // mov 0xc(%ebp),%edx
- .byte 139,58 // mov (%edx),%edi
- .byte 243,15,16,7 // movss (%edi),%xmm0
- .byte 243,15,16,79,4 // movss 0x4(%edi),%xmm1
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 15,40,224 // movaps %xmm0,%xmm4
+ .byte 139,69,12 // mov 0xc(%ebp),%eax
+ .byte 139,8 // mov (%eax),%ecx
+ .byte 243,15,16,1 // movss (%ecx),%xmm0
.byte 15,198,192,0 // shufps $0x0,%xmm0,%xmm0
- .byte 243,15,16,119,24 // movss 0x18(%edi),%xmm6
+ .byte 243,15,16,105,24 // movss 0x18(%ecx),%xmm5
+ .byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
+ .byte 243,15,16,113,36 // movss 0x24(%ecx),%xmm6
.byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6
- .byte 243,15,16,127,36 // movss 0x24(%edi),%xmm7
- .byte 15,198,255,0 // shufps $0x0,%xmm7,%xmm7
- .byte 15,89,242 // mulps %xmm2,%xmm6
- .byte 15,88,247 // addps %xmm7,%xmm6
- .byte 243,15,16,127,12 // movss 0xc(%edi),%xmm7
- .byte 15,198,255,0 // shufps $0x0,%xmm7,%xmm7
- .byte 15,89,252 // mulps %xmm4,%xmm7
- .byte 15,88,254 // addps %xmm6,%xmm7
- .byte 15,89,197 // mulps %xmm5,%xmm0
- .byte 15,88,199 // addps %xmm7,%xmm0
- .byte 15,198,201,0 // shufps $0x0,%xmm1,%xmm1
- .byte 243,15,16,119,28 // movss 0x1c(%edi),%xmm6
+ .byte 15,89,234 // mulps %xmm2,%xmm5
+ .byte 15,88,238 // addps %xmm6,%xmm5
+ .byte 243,15,16,113,12 // movss 0xc(%ecx),%xmm6
+ .byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6
+ .byte 15,89,241 // mulps %xmm1,%xmm6
+ .byte 15,88,245 // addps %xmm5,%xmm6
+ .byte 15,89,196 // mulps %xmm4,%xmm0
+ .byte 15,88,198 // addps %xmm6,%xmm0
+ .byte 243,15,16,105,28 // movss 0x1c(%ecx),%xmm5
+ .byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
+ .byte 243,15,16,113,40 // movss 0x28(%ecx),%xmm6
+ .byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6
+ .byte 15,89,234 // mulps %xmm2,%xmm5
+ .byte 15,88,238 // addps %xmm6,%xmm5
+ .byte 243,15,16,113,16 // movss 0x10(%ecx),%xmm6
+ .byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6
+ .byte 15,89,241 // mulps %xmm1,%xmm6
+ .byte 15,88,245 // addps %xmm5,%xmm6
+ .byte 243,15,16,105,4 // movss 0x4(%ecx),%xmm5
+ .byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
+ .byte 15,89,236 // mulps %xmm4,%xmm5
+ .byte 15,88,238 // addps %xmm6,%xmm5
+ .byte 243,15,16,113,32 // movss 0x20(%ecx),%xmm6
.byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6
- .byte 243,15,16,127,40 // movss 0x28(%edi),%xmm7
- .byte 15,198,255,0 // shufps $0x0,%xmm7,%xmm7
.byte 15,89,242 // mulps %xmm2,%xmm6
- .byte 15,88,247 // addps %xmm7,%xmm6
- .byte 243,15,16,127,16 // movss 0x10(%edi),%xmm7
+ .byte 243,15,16,81,44 // movss 0x2c(%ecx),%xmm2
+ .byte 15,198,210,0 // shufps $0x0,%xmm2,%xmm2
+ .byte 15,88,242 // addps %xmm2,%xmm6
+ .byte 243,15,16,121,20 // movss 0x14(%ecx),%xmm7
.byte 15,198,255,0 // shufps $0x0,%xmm7,%xmm7
- .byte 15,89,252 // mulps %xmm4,%xmm7
+ .byte 15,89,249 // mulps %xmm1,%xmm7
.byte 15,88,254 // addps %xmm6,%xmm7
- .byte 15,89,205 // mulps %xmm5,%xmm1
- .byte 15,88,207 // addps %xmm7,%xmm1
- .byte 243,15,16,119,8 // movss 0x8(%edi),%xmm6
- .byte 243,15,16,127,32 // movss 0x20(%edi),%xmm7
- .byte 15,198,255,0 // shufps $0x0,%xmm7,%xmm7
- .byte 15,89,250 // mulps %xmm2,%xmm7
- .byte 243,15,16,87,44 // movss 0x2c(%edi),%xmm2
- .byte 15,198,210,0 // shufps $0x0,%xmm2,%xmm2
- .byte 15,88,250 // addps %xmm2,%xmm7
- .byte 243,15,16,87,20 // movss 0x14(%edi),%xmm2
- .byte 139,125,24 // mov 0x18(%ebp),%edi
+ .byte 243,15,16,81,8 // movss 0x8(%ecx),%xmm2
.byte 15,198,210,0 // shufps $0x0,%xmm2,%xmm2
.byte 15,89,212 // mulps %xmm4,%xmm2
- .byte 15,40,101,40 // movaps 0x28(%ebp),%xmm4
.byte 15,88,215 // addps %xmm7,%xmm2
- .byte 15,40,125,56 // movaps 0x38(%ebp),%xmm7
- .byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6
- .byte 15,89,245 // mulps %xmm5,%xmm6
- .byte 15,40,109,72 // movaps 0x48(%ebp),%xmm5
- .byte 15,88,242 // addps %xmm2,%xmm6
- .byte 15,40,85,88 // movaps 0x58(%ebp),%xmm2
- .byte 141,90,8 // lea 0x8(%edx),%ebx
- .byte 15,41,84,36,80 // movaps %xmm2,0x50(%esp)
- .byte 15,41,108,36,64 // movaps %xmm5,0x40(%esp)
- .byte 15,41,124,36,48 // movaps %xmm7,0x30(%esp)
- .byte 15,41,100,36,32 // movaps %xmm4,0x20(%esp)
- .byte 137,124,36,16 // mov %edi,0x10(%esp)
- .byte 137,116,36,12 // mov %esi,0xc(%esp)
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
- .byte 15,40,214 // movaps %xmm6,%xmm2
- .byte 255,82,4 // call *0x4(%edx)
- .byte 131,196,108 // add $0x6c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 141,72,8 // lea 0x8(%eax),%ecx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 15,40,205 // movaps %xmm5,%xmm1
+ .byte 81 // push %ecx
+ .byte 255,117,8 // pushl 0x8(%ebp)
+ .byte 255,80,4 // call *0x4(%eax)
+ .byte 131,196,24 // add $0x18,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -58367,115 +56453,93 @@ FUNCTION(_sk_matrix_4x5_sse2)
_sk_matrix_4x5_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 131,236,124 // sub $0x7c,%esp
- .byte 15,40,226 // movaps %xmm2,%xmm4
+ .byte 131,236,8 // sub $0x8,%esp
.byte 15,40,233 // movaps %xmm1,%xmm5
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
- .byte 139,117,20 // mov 0x14(%ebp),%esi
- .byte 139,85,12 // mov 0xc(%ebp),%edx
- .byte 141,122,4 // lea 0x4(%edx),%edi
- .byte 137,125,240 // mov %edi,-0x10(%ebp)
- .byte 139,58 // mov (%edx),%edi
- .byte 243,15,16,23 // movss (%edi),%xmm2
- .byte 243,15,16,79,4 // movss 0x4(%edi),%xmm1
- .byte 15,198,210,0 // shufps $0x0,%xmm2,%xmm2
- .byte 243,15,16,119,48 // movss 0x30(%edi),%xmm6
+ .byte 139,69,12 // mov 0xc(%ebp),%eax
+ .byte 141,72,4 // lea 0x4(%eax),%ecx
+ .byte 137,77,252 // mov %ecx,-0x4(%ebp)
+ .byte 139,8 // mov (%eax),%ecx
+ .byte 243,15,16,33 // movss (%ecx),%xmm4
+ .byte 243,15,16,73,4 // movss 0x4(%ecx),%xmm1
+ .byte 15,198,228,0 // shufps $0x0,%xmm4,%xmm4
+ .byte 243,15,16,113,48 // movss 0x30(%ecx),%xmm6
.byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6
- .byte 243,15,16,127,64 // movss 0x40(%edi),%xmm7
+ .byte 243,15,16,121,64 // movss 0x40(%ecx),%xmm7
.byte 15,198,255,0 // shufps $0x0,%xmm7,%xmm7
.byte 15,89,243 // mulps %xmm3,%xmm6
.byte 15,88,247 // addps %xmm7,%xmm6
- .byte 243,15,16,127,32 // movss 0x20(%edi),%xmm7
+ .byte 243,15,16,121,32 // movss 0x20(%ecx),%xmm7
.byte 15,198,255,0 // shufps $0x0,%xmm7,%xmm7
- .byte 15,89,252 // mulps %xmm4,%xmm7
+ .byte 15,89,250 // mulps %xmm2,%xmm7
.byte 15,88,254 // addps %xmm6,%xmm7
- .byte 243,15,16,119,16 // movss 0x10(%edi),%xmm6
+ .byte 243,15,16,113,16 // movss 0x10(%ecx),%xmm6
.byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6
.byte 15,89,245 // mulps %xmm5,%xmm6
.byte 15,88,247 // addps %xmm7,%xmm6
- .byte 15,89,208 // mulps %xmm0,%xmm2
- .byte 15,88,214 // addps %xmm6,%xmm2
+ .byte 15,89,224 // mulps %xmm0,%xmm4
+ .byte 15,88,230 // addps %xmm6,%xmm4
.byte 15,198,201,0 // shufps $0x0,%xmm1,%xmm1
- .byte 243,15,16,119,52 // movss 0x34(%edi),%xmm6
+ .byte 243,15,16,113,52 // movss 0x34(%ecx),%xmm6
.byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6
- .byte 243,15,16,127,68 // movss 0x44(%edi),%xmm7
+ .byte 243,15,16,121,68 // movss 0x44(%ecx),%xmm7
.byte 15,198,255,0 // shufps $0x0,%xmm7,%xmm7
.byte 15,89,243 // mulps %xmm3,%xmm6
.byte 15,88,247 // addps %xmm7,%xmm6
- .byte 243,15,16,127,36 // movss 0x24(%edi),%xmm7
+ .byte 243,15,16,121,36 // movss 0x24(%ecx),%xmm7
.byte 15,198,255,0 // shufps $0x0,%xmm7,%xmm7
- .byte 15,89,252 // mulps %xmm4,%xmm7
+ .byte 15,89,250 // mulps %xmm2,%xmm7
.byte 15,88,254 // addps %xmm6,%xmm7
- .byte 243,15,16,119,20 // movss 0x14(%edi),%xmm6
+ .byte 243,15,16,113,20 // movss 0x14(%ecx),%xmm6
.byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6
.byte 15,89,245 // mulps %xmm5,%xmm6
- .byte 15,41,109,216 // movaps %xmm5,-0x28(%ebp)
.byte 15,88,247 // addps %xmm7,%xmm6
.byte 15,89,200 // mulps %xmm0,%xmm1
.byte 15,88,206 // addps %xmm6,%xmm1
- .byte 243,15,16,119,56 // movss 0x38(%edi),%xmm6
+ .byte 243,15,16,113,56 // movss 0x38(%ecx),%xmm6
.byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6
- .byte 243,15,16,127,72 // movss 0x48(%edi),%xmm7
+ .byte 243,15,16,121,72 // movss 0x48(%ecx),%xmm7
.byte 15,198,255,0 // shufps $0x0,%xmm7,%xmm7
.byte 15,89,243 // mulps %xmm3,%xmm6
.byte 15,88,247 // addps %xmm7,%xmm6
- .byte 243,15,16,127,40 // movss 0x28(%edi),%xmm7
+ .byte 243,15,16,121,40 // movss 0x28(%ecx),%xmm7
.byte 15,198,255,0 // shufps $0x0,%xmm7,%xmm7
- .byte 15,89,252 // mulps %xmm4,%xmm7
+ .byte 15,89,250 // mulps %xmm2,%xmm7
.byte 15,88,254 // addps %xmm6,%xmm7
- .byte 243,15,16,119,24 // movss 0x18(%edi),%xmm6
+ .byte 243,15,16,113,24 // movss 0x18(%ecx),%xmm6
.byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6
.byte 15,89,245 // mulps %xmm5,%xmm6
.byte 15,88,247 // addps %xmm7,%xmm6
- .byte 243,15,16,127,8 // movss 0x8(%edi),%xmm7
+ .byte 243,15,16,121,8 // movss 0x8(%ecx),%xmm7
.byte 15,198,255,0 // shufps $0x0,%xmm7,%xmm7
.byte 15,89,248 // mulps %xmm0,%xmm7
- .byte 15,40,232 // movaps %xmm0,%xmm5
.byte 15,88,254 // addps %xmm6,%xmm7
- .byte 243,15,16,119,60 // movss 0x3c(%edi),%xmm6
+ .byte 243,15,16,113,60 // movss 0x3c(%ecx),%xmm6
.byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6
.byte 15,89,243 // mulps %xmm3,%xmm6
- .byte 243,15,16,95,76 // movss 0x4c(%edi),%xmm3
+ .byte 243,15,16,89,76 // movss 0x4c(%ecx),%xmm3
.byte 15,198,219,0 // shufps $0x0,%xmm3,%xmm3
.byte 15,88,243 // addps %xmm3,%xmm6
- .byte 243,15,16,71,44 // movss 0x2c(%edi),%xmm0
- .byte 15,198,192,0 // shufps $0x0,%xmm0,%xmm0
- .byte 15,89,196 // mulps %xmm4,%xmm0
- .byte 243,15,16,95,12 // movss 0xc(%edi),%xmm3
- .byte 15,88,198 // addps %xmm6,%xmm0
- .byte 243,15,16,103,28 // movss 0x1c(%edi),%xmm4
- .byte 139,125,24 // mov 0x18(%ebp),%edi
- .byte 15,198,228,0 // shufps $0x0,%xmm4,%xmm4
- .byte 15,89,101,216 // mulps -0x28(%ebp),%xmm4
- .byte 15,88,224 // addps %xmm0,%xmm4
- .byte 15,40,69,56 // movaps 0x38(%ebp),%xmm0
+ .byte 243,15,16,89,44 // movss 0x2c(%ecx),%xmm3
.byte 15,198,219,0 // shufps $0x0,%xmm3,%xmm3
- .byte 15,89,221 // mulps %xmm5,%xmm3
- .byte 15,40,117,72 // movaps 0x48(%ebp),%xmm6
- .byte 15,88,220 // addps %xmm4,%xmm3
- .byte 15,40,101,88 // movaps 0x58(%ebp),%xmm4
- .byte 141,90,8 // lea 0x8(%edx),%ebx
- .byte 15,41,100,36,80 // movaps %xmm4,0x50(%esp)
- .byte 15,41,116,36,64 // movaps %xmm6,0x40(%esp)
- .byte 15,41,68,36,48 // movaps %xmm0,0x30(%esp)
- .byte 15,40,69,40 // movaps 0x28(%ebp),%xmm0
- .byte 15,41,68,36,32 // movaps %xmm0,0x20(%esp)
- .byte 137,124,36,16 // mov %edi,0x10(%esp)
- .byte 137,116,36,12 // mov %esi,0xc(%esp)
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
- .byte 15,40,194 // movaps %xmm2,%xmm0
+ .byte 15,89,218 // mulps %xmm2,%xmm3
+ .byte 15,88,222 // addps %xmm6,%xmm3
+ .byte 243,15,16,81,28 // movss 0x1c(%ecx),%xmm2
+ .byte 15,198,210,0 // shufps $0x0,%xmm2,%xmm2
+ .byte 15,89,213 // mulps %xmm5,%xmm2
+ .byte 15,88,211 // addps %xmm3,%xmm2
+ .byte 243,15,16,89,12 // movss 0xc(%ecx),%xmm3
+ .byte 15,198,219,0 // shufps $0x0,%xmm3,%xmm3
+ .byte 15,89,216 // mulps %xmm0,%xmm3
+ .byte 15,88,218 // addps %xmm2,%xmm3
+ .byte 139,77,8 // mov 0x8(%ebp),%ecx
+ .byte 141,80,8 // lea 0x8(%eax),%edx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 15,40,196 // movaps %xmm4,%xmm0
.byte 15,40,215 // movaps %xmm7,%xmm2
- .byte 255,82,4 // call *0x4(%edx)
- .byte 131,196,124 // add $0x7c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 82 // push %edx
+ .byte 81 // push %ecx
+ .byte 255,80,4 // call *0x4(%eax)
+ .byte 131,196,24 // add $0x18,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -58485,77 +56549,57 @@ FUNCTION(_sk_matrix_4x3_sse2)
_sk_matrix_4x3_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
+ .byte 131,236,8 // sub $0x8,%esp
.byte 15,40,233 // movaps %xmm1,%xmm5
.byte 15,40,224 // movaps %xmm0,%xmm4
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
- .byte 139,117,20 // mov 0x14(%ebp),%esi
- .byte 139,85,12 // mov 0xc(%ebp),%edx
- .byte 139,58 // mov (%edx),%edi
- .byte 243,15,16,7 // movss (%edi),%xmm0
- .byte 243,15,16,79,4 // movss 0x4(%edi),%xmm1
+ .byte 139,69,12 // mov 0xc(%ebp),%eax
+ .byte 139,8 // mov (%eax),%ecx
+ .byte 243,15,16,1 // movss (%ecx),%xmm0
+ .byte 243,15,16,73,4 // movss 0x4(%ecx),%xmm1
.byte 15,198,192,0 // shufps $0x0,%xmm0,%xmm0
- .byte 243,15,16,87,16 // movss 0x10(%edi),%xmm2
+ .byte 243,15,16,81,16 // movss 0x10(%ecx),%xmm2
.byte 15,198,210,0 // shufps $0x0,%xmm2,%xmm2
- .byte 243,15,16,95,32 // movss 0x20(%edi),%xmm3
+ .byte 243,15,16,89,32 // movss 0x20(%ecx),%xmm3
.byte 15,198,219,0 // shufps $0x0,%xmm3,%xmm3
.byte 15,89,213 // mulps %xmm5,%xmm2
.byte 15,88,211 // addps %xmm3,%xmm2
.byte 15,89,196 // mulps %xmm4,%xmm0
.byte 15,88,194 // addps %xmm2,%xmm0
.byte 15,198,201,0 // shufps $0x0,%xmm1,%xmm1
- .byte 243,15,16,87,20 // movss 0x14(%edi),%xmm2
+ .byte 243,15,16,81,20 // movss 0x14(%ecx),%xmm2
.byte 15,198,210,0 // shufps $0x0,%xmm2,%xmm2
- .byte 243,15,16,95,36 // movss 0x24(%edi),%xmm3
+ .byte 243,15,16,89,36 // movss 0x24(%ecx),%xmm3
.byte 15,198,219,0 // shufps $0x0,%xmm3,%xmm3
.byte 15,89,213 // mulps %xmm5,%xmm2
.byte 15,88,211 // addps %xmm3,%xmm2
.byte 15,89,204 // mulps %xmm4,%xmm1
.byte 15,88,202 // addps %xmm2,%xmm1
- .byte 243,15,16,87,8 // movss 0x8(%edi),%xmm2
+ .byte 243,15,16,81,8 // movss 0x8(%ecx),%xmm2
.byte 15,198,210,0 // shufps $0x0,%xmm2,%xmm2
- .byte 243,15,16,95,24 // movss 0x18(%edi),%xmm3
+ .byte 243,15,16,89,24 // movss 0x18(%ecx),%xmm3
.byte 15,198,219,0 // shufps $0x0,%xmm3,%xmm3
- .byte 243,15,16,119,40 // movss 0x28(%edi),%xmm6
+ .byte 243,15,16,113,40 // movss 0x28(%ecx),%xmm6
.byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6
.byte 15,89,221 // mulps %xmm5,%xmm3
.byte 15,88,222 // addps %xmm6,%xmm3
.byte 15,89,212 // mulps %xmm4,%xmm2
.byte 15,88,211 // addps %xmm3,%xmm2
- .byte 243,15,16,95,12 // movss 0xc(%edi),%xmm3
- .byte 243,15,16,119,28 // movss 0x1c(%edi),%xmm6
- .byte 243,15,16,127,44 // movss 0x2c(%edi),%xmm7
- .byte 139,125,24 // mov 0x18(%ebp),%edi
+ .byte 243,15,16,89,12 // movss 0xc(%ecx),%xmm3
+ .byte 15,198,219,0 // shufps $0x0,%xmm3,%xmm3
+ .byte 243,15,16,113,28 // movss 0x1c(%ecx),%xmm6
.byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6
- .byte 15,89,245 // mulps %xmm5,%xmm6
- .byte 15,40,109,40 // movaps 0x28(%ebp),%xmm5
+ .byte 243,15,16,121,44 // movss 0x2c(%ecx),%xmm7
.byte 15,198,255,0 // shufps $0x0,%xmm7,%xmm7
+ .byte 15,89,245 // mulps %xmm5,%xmm6
.byte 15,88,247 // addps %xmm7,%xmm6
- .byte 15,40,125,56 // movaps 0x38(%ebp),%xmm7
- .byte 15,198,219,0 // shufps $0x0,%xmm3,%xmm3
.byte 15,89,220 // mulps %xmm4,%xmm3
- .byte 15,40,101,72 // movaps 0x48(%ebp),%xmm4
.byte 15,88,222 // addps %xmm6,%xmm3
- .byte 15,40,117,88 // movaps 0x58(%ebp),%xmm6
- .byte 141,90,8 // lea 0x8(%edx),%ebx
- .byte 15,41,116,36,80 // movaps %xmm6,0x50(%esp)
- .byte 15,41,100,36,64 // movaps %xmm4,0x40(%esp)
- .byte 15,41,124,36,48 // movaps %xmm7,0x30(%esp)
- .byte 15,41,108,36,32 // movaps %xmm5,0x20(%esp)
- .byte 137,124,36,16 // mov %edi,0x10(%esp)
- .byte 137,116,36,12 // mov %esi,0xc(%esp)
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
- .byte 255,82,4 // call *0x4(%edx)
- .byte 131,196,108 // add $0x6c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 141,72,8 // lea 0x8(%eax),%ecx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 81 // push %ecx
+ .byte 255,117,8 // pushl 0x8(%ebp)
+ .byte 255,80,4 // call *0x4(%eax)
+ .byte 131,196,24 // add $0x18,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -58565,70 +56609,50 @@ FUNCTION(_sk_matrix_perspective_sse2)
_sk_matrix_perspective_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
+ .byte 131,236,8 // sub $0x8,%esp
.byte 15,40,224 // movaps %xmm0,%xmm4
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
- .byte 139,117,20 // mov 0x14(%ebp),%esi
- .byte 139,85,12 // mov 0xc(%ebp),%edx
- .byte 139,58 // mov (%edx),%edi
- .byte 243,15,16,7 // movss (%edi),%xmm0
- .byte 243,15,16,111,4 // movss 0x4(%edi),%xmm5
+ .byte 139,69,12 // mov 0xc(%ebp),%eax
+ .byte 139,8 // mov (%eax),%ecx
+ .byte 243,15,16,1 // movss (%ecx),%xmm0
+ .byte 243,15,16,105,4 // movss 0x4(%ecx),%xmm5
.byte 15,198,192,0 // shufps $0x0,%xmm0,%xmm0
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
- .byte 243,15,16,119,8 // movss 0x8(%edi),%xmm6
+ .byte 243,15,16,113,8 // movss 0x8(%ecx),%xmm6
.byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6
.byte 15,89,233 // mulps %xmm1,%xmm5
.byte 15,88,238 // addps %xmm6,%xmm5
.byte 15,89,196 // mulps %xmm4,%xmm0
.byte 15,88,197 // addps %xmm5,%xmm0
- .byte 243,15,16,111,12 // movss 0xc(%edi),%xmm5
- .byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
- .byte 243,15,16,119,16 // movss 0x10(%edi),%xmm6
+ .byte 243,15,16,113,16 // movss 0x10(%ecx),%xmm6
.byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6
- .byte 243,15,16,127,20 // movss 0x14(%edi),%xmm7
- .byte 15,198,255,0 // shufps $0x0,%xmm7,%xmm7
+ .byte 243,15,16,105,20 // movss 0x14(%ecx),%xmm5
+ .byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
.byte 15,89,241 // mulps %xmm1,%xmm6
- .byte 15,88,247 // addps %xmm7,%xmm6
+ .byte 15,88,245 // addps %xmm5,%xmm6
+ .byte 243,15,16,105,12 // movss 0xc(%ecx),%xmm5
+ .byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
.byte 15,89,236 // mulps %xmm4,%xmm5
.byte 15,88,238 // addps %xmm6,%xmm5
- .byte 243,15,16,119,24 // movss 0x18(%edi),%xmm6
- .byte 243,15,16,127,28 // movss 0x1c(%edi),%xmm7
- .byte 15,198,255,0 // shufps $0x0,%xmm7,%xmm7
- .byte 15,89,249 // mulps %xmm1,%xmm7
- .byte 243,15,16,79,32 // movss 0x20(%edi),%xmm1
- .byte 139,125,24 // mov 0x18(%ebp),%edi
- .byte 15,198,201,0 // shufps $0x0,%xmm1,%xmm1
- .byte 15,88,249 // addps %xmm1,%xmm7
- .byte 15,40,77,40 // movaps 0x28(%ebp),%xmm1
+ .byte 243,15,16,113,28 // movss 0x1c(%ecx),%xmm6
.byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6
- .byte 15,89,244 // mulps %xmm4,%xmm6
- .byte 15,40,101,56 // movaps 0x38(%ebp),%xmm4
- .byte 15,88,247 // addps %xmm7,%xmm6
- .byte 15,40,125,72 // movaps 0x48(%ebp),%xmm7
- .byte 15,83,246 // rcpps %xmm6,%xmm6
- .byte 15,89,198 // mulps %xmm6,%xmm0
- .byte 15,89,238 // mulps %xmm6,%xmm5
- .byte 15,40,117,88 // movaps 0x58(%ebp),%xmm6
- .byte 141,90,8 // lea 0x8(%edx),%ebx
- .byte 15,41,116,36,80 // movaps %xmm6,0x50(%esp)
- .byte 15,41,124,36,64 // movaps %xmm7,0x40(%esp)
- .byte 15,41,100,36,48 // movaps %xmm4,0x30(%esp)
- .byte 15,41,76,36,32 // movaps %xmm1,0x20(%esp)
- .byte 137,124,36,16 // mov %edi,0x10(%esp)
- .byte 137,116,36,12 // mov %esi,0xc(%esp)
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
+ .byte 15,89,241 // mulps %xmm1,%xmm6
+ .byte 243,15,16,73,32 // movss 0x20(%ecx),%xmm1
+ .byte 15,198,201,0 // shufps $0x0,%xmm1,%xmm1
+ .byte 15,88,241 // addps %xmm1,%xmm6
+ .byte 243,15,16,73,24 // movss 0x18(%ecx),%xmm1
+ .byte 15,198,201,0 // shufps $0x0,%xmm1,%xmm1
+ .byte 15,89,204 // mulps %xmm4,%xmm1
+ .byte 15,88,206 // addps %xmm6,%xmm1
+ .byte 15,83,201 // rcpps %xmm1,%xmm1
+ .byte 15,89,193 // mulps %xmm1,%xmm0
+ .byte 15,89,233 // mulps %xmm1,%xmm5
+ .byte 141,72,8 // lea 0x8(%eax),%ecx
+ .byte 131,236,8 // sub $0x8,%esp
.byte 15,40,205 // movaps %xmm5,%xmm1
- .byte 255,82,4 // call *0x4(%edx)
- .byte 131,196,108 // add $0x6c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 81 // push %ecx
+ .byte 255,117,8 // pushl 0x8(%ebp)
+ .byte 255,80,4 // call *0x4(%eax)
+ .byte 131,196,24 // add $0x18,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -58641,9 +56665,9 @@ _sk_evenly_spaced_gradient_sse2:
.byte 83 // push %ebx
.byte 87 // push %edi
.byte 86 // push %esi
- .byte 129,236,156,0,0,0 // sub $0x9c,%esp
+ .byte 131,236,60 // sub $0x3c,%esp
.byte 15,41,69,184 // movaps %xmm0,-0x48(%ebp)
- .byte 232,0,0,0,0 // call 7e0a <_sk_evenly_spaced_gradient_sse2+0x15>
+ .byte 232,0,0,0,0 // call 61b2 <_sk_evenly_spaced_gradient_sse2+0x12>
.byte 90 // pop %edx
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 141,65,4 // lea 0x4(%ecx),%eax
@@ -58654,12 +56678,12 @@ _sk_evenly_spaced_gradient_sse2:
.byte 78 // dec %esi
.byte 102,15,110,206 // movd %esi,%xmm1
.byte 102,15,112,201,0 // pshufd $0x0,%xmm1,%xmm1
- .byte 102,15,111,146,70,36,0,0 // movdqa 0x2446(%edx),%xmm2
+ .byte 102,15,111,146,174,29,0,0 // movdqa 0x1dae(%edx),%xmm2
.byte 102,15,219,209 // pand %xmm1,%xmm2
- .byte 102,15,235,146,86,36,0,0 // por 0x2456(%edx),%xmm2
+ .byte 102,15,235,146,190,29,0,0 // por 0x1dbe(%edx),%xmm2
.byte 102,15,114,209,16 // psrld $0x10,%xmm1
- .byte 102,15,235,138,102,36,0,0 // por 0x2466(%edx),%xmm1
- .byte 15,88,138,118,36,0,0 // addps 0x2476(%edx),%xmm1
+ .byte 102,15,235,138,206,29,0,0 // por 0x1dce(%edx),%xmm1
+ .byte 15,88,138,222,29,0,0 // addps 0x1dde(%edx),%xmm1
.byte 15,88,202 // addps %xmm2,%xmm1
.byte 15,89,200 // mulps %xmm0,%xmm1
.byte 243,15,91,201 // cvttps2dq %xmm1,%xmm1
@@ -58735,37 +56759,24 @@ _sk_evenly_spaced_gradient_sse2:
.byte 243,15,16,52,152 // movss (%eax,%ebx,4),%xmm6
.byte 15,20,198 // unpcklps %xmm6,%xmm0
.byte 15,20,197 // unpcklps %xmm5,%xmm0
- .byte 15,40,117,184 // movaps -0x48(%ebp),%xmm6
- .byte 15,89,230 // mulps %xmm6,%xmm4
+ .byte 15,40,109,184 // movaps -0x48(%ebp),%xmm5
+ .byte 15,89,229 // mulps %xmm5,%xmm4
.byte 15,88,101,200 // addps -0x38(%ebp),%xmm4
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
- .byte 139,85,20 // mov 0x14(%ebp),%edx
- .byte 139,117,24 // mov 0x18(%ebp),%esi
- .byte 15,89,206 // mulps %xmm6,%xmm1
+ .byte 15,89,205 // mulps %xmm5,%xmm1
.byte 15,88,77,216 // addps -0x28(%ebp),%xmm1
- .byte 15,89,214 // mulps %xmm6,%xmm2
+ .byte 15,89,213 // mulps %xmm5,%xmm2
.byte 15,88,215 // addps %xmm7,%xmm2
- .byte 15,40,109,56 // movaps 0x38(%ebp),%xmm5
- .byte 15,89,222 // mulps %xmm6,%xmm3
- .byte 15,40,125,72 // movaps 0x48(%ebp),%xmm7
+ .byte 15,89,221 // mulps %xmm5,%xmm3
.byte 15,88,216 // addps %xmm0,%xmm3
- .byte 15,40,69,88 // movaps 0x58(%ebp),%xmm0
- .byte 139,93,12 // mov 0xc(%ebp),%ebx
- .byte 141,123,8 // lea 0x8(%ebx),%edi
- .byte 15,41,68,36,80 // movaps %xmm0,0x50(%esp)
- .byte 15,41,124,36,64 // movaps %xmm7,0x40(%esp)
- .byte 15,41,108,36,48 // movaps %xmm5,0x30(%esp)
- .byte 15,40,69,40 // movaps 0x28(%ebp),%xmm0
- .byte 15,41,68,36,32 // movaps %xmm0,0x20(%esp)
- .byte 137,116,36,16 // mov %esi,0x10(%esp)
- .byte 137,84,36,12 // mov %edx,0xc(%esp)
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,124,36,4 // mov %edi,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
+ .byte 139,69,8 // mov 0x8(%ebp),%eax
+ .byte 139,85,12 // mov 0xc(%ebp),%edx
+ .byte 141,74,8 // lea 0x8(%edx),%ecx
+ .byte 131,236,8 // sub $0x8,%esp
.byte 15,40,196 // movaps %xmm4,%xmm0
- .byte 255,83,4 // call *0x4(%ebx)
- .byte 129,196,156,0,0,0 // add $0x9c,%esp
+ .byte 81 // push %ecx
+ .byte 80 // push %eax
+ .byte 255,82,4 // call *0x4(%edx)
+ .byte 131,196,76 // add $0x4c,%esp
.byte 94 // pop %esi
.byte 95 // pop %edi
.byte 91 // pop %ebx
@@ -58778,48 +56789,28 @@ FUNCTION(_sk_gauss_a_to_rgba_sse2)
_sk_gauss_a_to_rgba_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 232,0,0,0,0 // call 8001 <_sk_gauss_a_to_rgba_sse2+0xe>
- .byte 90 // pop %edx
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
- .byte 139,117,20 // mov 0x14(%ebp),%esi
- .byte 139,125,24 // mov 0x18(%ebp),%edi
- .byte 15,40,77,40 // movaps 0x28(%ebp),%xmm1
- .byte 15,40,85,56 // movaps 0x38(%ebp),%xmm2
- .byte 15,40,101,72 // movaps 0x48(%ebp),%xmm4
- .byte 15,40,109,88 // movaps 0x58(%ebp),%xmm5
- .byte 15,40,130,143,34,0,0 // movaps 0x228f(%edx),%xmm0
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 232,0,0,0,0 // call 6368 <_sk_gauss_a_to_rgba_sse2+0xb>
+ .byte 88 // pop %eax
+ .byte 139,77,12 // mov 0xc(%ebp),%ecx
+ .byte 15,40,128,56,28,0,0 // movaps 0x1c38(%eax),%xmm0
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,130,159,34,0,0 // addps 0x229f(%edx),%xmm0
+ .byte 15,88,128,72,28,0,0 // addps 0x1c48(%eax),%xmm0
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,130,175,34,0,0 // addps 0x22af(%edx),%xmm0
+ .byte 15,88,128,88,28,0,0 // addps 0x1c58(%eax),%xmm0
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,130,191,34,0,0 // addps 0x22bf(%edx),%xmm0
+ .byte 15,88,128,104,28,0,0 // addps 0x1c68(%eax),%xmm0
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,130,207,34,0,0 // addps 0x22cf(%edx),%xmm0
- .byte 139,85,12 // mov 0xc(%ebp),%edx
- .byte 141,90,4 // lea 0x4(%edx),%ebx
- .byte 15,41,108,36,80 // movaps %xmm5,0x50(%esp)
- .byte 15,41,100,36,64 // movaps %xmm4,0x40(%esp)
- .byte 15,41,84,36,48 // movaps %xmm2,0x30(%esp)
- .byte 15,41,76,36,32 // movaps %xmm1,0x20(%esp)
- .byte 137,124,36,16 // mov %edi,0x10(%esp)
- .byte 137,116,36,12 // mov %esi,0xc(%esp)
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
+ .byte 15,88,128,120,28,0,0 // addps 0x1c78(%eax),%xmm0
+ .byte 141,65,4 // lea 0x4(%ecx),%eax
+ .byte 131,236,8 // sub $0x8,%esp
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 15,40,216 // movaps %xmm0,%xmm3
- .byte 255,18 // call *(%edx)
- .byte 131,196,108 // add $0x6c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 80 // push %eax
+ .byte 255,117,8 // pushl 0x8(%ebp)
+ .byte 255,17 // call *(%ecx)
+ .byte 131,196,24 // add $0x18,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -58832,102 +56823,102 @@ _sk_gradient_sse2:
.byte 83 // push %ebx
.byte 87 // push %edi
.byte 86 // push %esi
- .byte 129,236,156,0,0,0 // sub $0x9c,%esp
- .byte 232,0,0,0,0 // call 809e <_sk_gradient_sse2+0x11>
- .byte 90 // pop %edx
- .byte 139,69,12 // mov 0xc(%ebp),%eax
- .byte 141,72,4 // lea 0x4(%eax),%ecx
- .byte 137,77,240 // mov %ecx,-0x10(%ebp)
- .byte 139,56 // mov (%eax),%edi
- .byte 139,7 // mov (%edi),%eax
+ .byte 131,236,60 // sub $0x3c,%esp
+ .byte 232,0,0,0,0 // call 63c3 <_sk_gradient_sse2+0xe>
+ .byte 95 // pop %edi
+ .byte 139,77,12 // mov 0xc(%ebp),%ecx
+ .byte 141,81,4 // lea 0x4(%ecx),%edx
+ .byte 137,85,240 // mov %edx,-0x10(%ebp)
+ .byte 139,9 // mov (%ecx),%ecx
+ .byte 139,17 // mov (%ecx),%edx
.byte 102,15,239,201 // pxor %xmm1,%xmm1
- .byte 131,248,2 // cmp $0x2,%eax
- .byte 114,43 // jb 80e0 <_sk_gradient_sse2+0x53>
- .byte 139,79,36 // mov 0x24(%edi),%ecx
- .byte 72 // dec %eax
- .byte 131,193,4 // add $0x4,%ecx
+ .byte 131,250,2 // cmp $0x2,%edx
+ .byte 114,43 // jb 6405 <_sk_gradient_sse2+0x50>
+ .byte 139,113,36 // mov 0x24(%ecx),%esi
+ .byte 74 // dec %edx
+ .byte 131,198,4 // add $0x4,%esi
.byte 102,15,239,201 // pxor %xmm1,%xmm1
- .byte 15,40,146,66,34,0,0 // movaps 0x2242(%edx),%xmm2
- .byte 243,15,16,25 // movss (%ecx),%xmm3
+ .byte 15,40,151,45,28,0,0 // movaps 0x1c2d(%edi),%xmm2
+ .byte 243,15,16,30 // movss (%esi),%xmm3
.byte 15,198,219,0 // shufps $0x0,%xmm3,%xmm3
.byte 15,194,216,2 // cmpleps %xmm0,%xmm3
.byte 15,84,218 // andps %xmm2,%xmm3
.byte 102,15,254,203 // paddd %xmm3,%xmm1
- .byte 131,193,4 // add $0x4,%ecx
- .byte 72 // dec %eax
- .byte 117,231 // jne 80c7 <_sk_gradient_sse2+0x3a>
- .byte 102,15,126,203 // movd %xmm1,%ebx
+ .byte 131,198,4 // add $0x4,%esi
+ .byte 74 // dec %edx
+ .byte 117,231 // jne 63ec <_sk_gradient_sse2+0x37>
+ .byte 102,15,126,202 // movd %xmm1,%edx
.byte 102,15,112,209,229 // pshufd $0xe5,%xmm1,%xmm2
- .byte 102,15,126,208 // movd %xmm2,%eax
+ .byte 102,15,126,214 // movd %xmm2,%esi
.byte 102,15,112,209,78 // pshufd $0x4e,%xmm1,%xmm2
.byte 102,15,112,201,231 // pshufd $0xe7,%xmm1,%xmm1
- .byte 102,15,126,201 // movd %xmm1,%ecx
- .byte 139,119,4 // mov 0x4(%edi),%esi
- .byte 243,15,16,12,142 // movss (%esi,%ecx,4),%xmm1
- .byte 243,15,16,28,134 // movss (%esi,%eax,4),%xmm3
- .byte 243,15,16,36,158 // movss (%esi,%ebx,4),%xmm4
- .byte 102,15,126,210 // movd %xmm2,%edx
- .byte 243,15,16,20,150 // movss (%esi,%edx,4),%xmm2
+ .byte 102,15,126,207 // movd %xmm1,%edi
+ .byte 139,65,4 // mov 0x4(%ecx),%eax
+ .byte 243,15,16,12,184 // movss (%eax,%edi,4),%xmm1
+ .byte 243,15,16,28,176 // movss (%eax,%esi,4),%xmm3
+ .byte 243,15,16,36,144 // movss (%eax,%edx,4),%xmm4
+ .byte 102,15,126,211 // movd %xmm2,%ebx
+ .byte 243,15,16,20,152 // movss (%eax,%ebx,4),%xmm2
.byte 15,20,217 // unpcklps %xmm1,%xmm3
- .byte 139,119,20 // mov 0x14(%edi),%esi
- .byte 243,15,16,12,142 // movss (%esi,%ecx,4),%xmm1
- .byte 243,15,16,52,134 // movss (%esi,%eax,4),%xmm6
- .byte 243,15,16,44,158 // movss (%esi,%ebx,4),%xmm5
- .byte 243,15,16,60,150 // movss (%esi,%edx,4),%xmm7
+ .byte 139,65,20 // mov 0x14(%ecx),%eax
+ .byte 243,15,16,12,184 // movss (%eax,%edi,4),%xmm1
+ .byte 243,15,16,52,176 // movss (%eax,%esi,4),%xmm6
+ .byte 243,15,16,44,144 // movss (%eax,%edx,4),%xmm5
+ .byte 243,15,16,60,152 // movss (%eax,%ebx,4),%xmm7
.byte 15,20,226 // unpcklps %xmm2,%xmm4
.byte 15,20,227 // unpcklps %xmm3,%xmm4
.byte 15,41,101,184 // movaps %xmm4,-0x48(%ebp)
.byte 15,20,241 // unpcklps %xmm1,%xmm6
.byte 15,20,239 // unpcklps %xmm7,%xmm5
- .byte 139,119,8 // mov 0x8(%edi),%esi
- .byte 243,15,16,20,142 // movss (%esi,%ecx,4),%xmm2
- .byte 243,15,16,28,134 // movss (%esi,%eax,4),%xmm3
- .byte 243,15,16,12,158 // movss (%esi,%ebx,4),%xmm1
- .byte 243,15,16,60,150 // movss (%esi,%edx,4),%xmm7
+ .byte 139,65,8 // mov 0x8(%ecx),%eax
+ .byte 243,15,16,20,184 // movss (%eax,%edi,4),%xmm2
+ .byte 243,15,16,28,176 // movss (%eax,%esi,4),%xmm3
+ .byte 243,15,16,12,144 // movss (%eax,%edx,4),%xmm1
+ .byte 243,15,16,60,152 // movss (%eax,%ebx,4),%xmm7
.byte 15,20,238 // unpcklps %xmm6,%xmm5
.byte 15,41,109,200 // movaps %xmm5,-0x38(%ebp)
.byte 15,20,218 // unpcklps %xmm2,%xmm3
.byte 15,20,207 // unpcklps %xmm7,%xmm1
.byte 15,20,203 // unpcklps %xmm3,%xmm1
- .byte 139,119,24 // mov 0x18(%edi),%esi
- .byte 243,15,16,20,142 // movss (%esi,%ecx,4),%xmm2
- .byte 243,15,16,28,134 // movss (%esi,%eax,4),%xmm3
- .byte 243,15,16,36,158 // movss (%esi,%ebx,4),%xmm4
- .byte 243,15,16,60,150 // movss (%esi,%edx,4),%xmm7
+ .byte 139,65,24 // mov 0x18(%ecx),%eax
+ .byte 243,15,16,20,184 // movss (%eax,%edi,4),%xmm2
+ .byte 243,15,16,28,176 // movss (%eax,%esi,4),%xmm3
+ .byte 243,15,16,36,144 // movss (%eax,%edx,4),%xmm4
+ .byte 243,15,16,60,152 // movss (%eax,%ebx,4),%xmm7
.byte 15,20,218 // unpcklps %xmm2,%xmm3
.byte 15,20,231 // unpcklps %xmm7,%xmm4
.byte 15,20,227 // unpcklps %xmm3,%xmm4
.byte 15,41,101,216 // movaps %xmm4,-0x28(%ebp)
- .byte 139,119,12 // mov 0xc(%edi),%esi
- .byte 243,15,16,20,142 // movss (%esi,%ecx,4),%xmm2
- .byte 243,15,16,28,134 // movss (%esi,%eax,4),%xmm3
+ .byte 139,65,12 // mov 0xc(%ecx),%eax
+ .byte 243,15,16,20,184 // movss (%eax,%edi,4),%xmm2
+ .byte 243,15,16,28,176 // movss (%eax,%esi,4),%xmm3
.byte 15,20,218 // unpcklps %xmm2,%xmm3
- .byte 243,15,16,20,158 // movss (%esi,%ebx,4),%xmm2
- .byte 243,15,16,60,150 // movss (%esi,%edx,4),%xmm7
+ .byte 243,15,16,20,144 // movss (%eax,%edx,4),%xmm2
+ .byte 243,15,16,60,152 // movss (%eax,%ebx,4),%xmm7
.byte 15,20,215 // unpcklps %xmm7,%xmm2
.byte 15,20,211 // unpcklps %xmm3,%xmm2
- .byte 139,119,28 // mov 0x1c(%edi),%esi
- .byte 243,15,16,60,142 // movss (%esi,%ecx,4),%xmm7
- .byte 243,15,16,28,134 // movss (%esi,%eax,4),%xmm3
+ .byte 139,65,28 // mov 0x1c(%ecx),%eax
+ .byte 243,15,16,60,184 // movss (%eax,%edi,4),%xmm7
+ .byte 243,15,16,28,176 // movss (%eax,%esi,4),%xmm3
.byte 15,20,223 // unpcklps %xmm7,%xmm3
- .byte 243,15,16,60,158 // movss (%esi,%ebx,4),%xmm7
- .byte 243,15,16,44,150 // movss (%esi,%edx,4),%xmm5
+ .byte 243,15,16,60,144 // movss (%eax,%edx,4),%xmm7
+ .byte 243,15,16,44,152 // movss (%eax,%ebx,4),%xmm5
.byte 15,20,253 // unpcklps %xmm5,%xmm7
.byte 15,20,251 // unpcklps %xmm3,%xmm7
- .byte 139,119,16 // mov 0x10(%edi),%esi
- .byte 243,15,16,28,142 // movss (%esi,%ecx,4),%xmm3
- .byte 243,15,16,44,134 // movss (%esi,%eax,4),%xmm5
+ .byte 139,65,16 // mov 0x10(%ecx),%eax
+ .byte 243,15,16,28,184 // movss (%eax,%edi,4),%xmm3
+ .byte 243,15,16,44,176 // movss (%eax,%esi,4),%xmm5
.byte 15,20,235 // unpcklps %xmm3,%xmm5
- .byte 243,15,16,28,158 // movss (%esi,%ebx,4),%xmm3
- .byte 243,15,16,52,150 // movss (%esi,%edx,4),%xmm6
+ .byte 243,15,16,28,144 // movss (%eax,%edx,4),%xmm3
+ .byte 243,15,16,52,152 // movss (%eax,%ebx,4),%xmm6
.byte 15,20,222 // unpcklps %xmm6,%xmm3
.byte 15,20,221 // unpcklps %xmm5,%xmm3
- .byte 139,119,32 // mov 0x20(%edi),%esi
- .byte 243,15,16,44,142 // movss (%esi,%ecx,4),%xmm5
- .byte 243,15,16,52,134 // movss (%esi,%eax,4),%xmm6
+ .byte 139,65,32 // mov 0x20(%ecx),%eax
+ .byte 243,15,16,44,184 // movss (%eax,%edi,4),%xmm5
+ .byte 243,15,16,52,176 // movss (%eax,%esi,4),%xmm6
.byte 15,20,245 // unpcklps %xmm5,%xmm6
- .byte 243,15,16,44,158 // movss (%esi,%ebx,4),%xmm5
- .byte 243,15,16,36,150 // movss (%esi,%edx,4),%xmm4
+ .byte 243,15,16,44,144 // movss (%eax,%edx,4),%xmm5
+ .byte 243,15,16,36,152 // movss (%eax,%ebx,4),%xmm4
.byte 15,20,236 // unpcklps %xmm4,%xmm5
.byte 15,20,238 // unpcklps %xmm6,%xmm5
.byte 15,40,101,184 // movaps -0x48(%ebp),%xmm4
@@ -58941,26 +56932,12 @@ _sk_gradient_sse2:
.byte 15,88,221 // addps %xmm5,%xmm3
.byte 139,69,240 // mov -0x10(%ebp),%eax
.byte 141,72,4 // lea 0x4(%eax),%ecx
- .byte 15,40,69,88 // movaps 0x58(%ebp),%xmm0
- .byte 15,41,68,36,80 // movaps %xmm0,0x50(%esp)
- .byte 15,40,69,72 // movaps 0x48(%ebp),%xmm0
- .byte 15,41,68,36,64 // movaps %xmm0,0x40(%esp)
- .byte 15,40,69,56 // movaps 0x38(%ebp),%xmm0
- .byte 15,41,68,36,48 // movaps %xmm0,0x30(%esp)
- .byte 15,40,69,40 // movaps 0x28(%ebp),%xmm0
- .byte 15,41,68,36,32 // movaps %xmm0,0x20(%esp)
- .byte 139,85,24 // mov 0x18(%ebp),%edx
- .byte 137,84,36,16 // mov %edx,0x10(%esp)
- .byte 139,85,20 // mov 0x14(%ebp),%edx
- .byte 137,84,36,12 // mov %edx,0xc(%esp)
- .byte 139,85,16 // mov 0x10(%ebp),%edx
- .byte 137,84,36,8 // mov %edx,0x8(%esp)
- .byte 137,76,36,4 // mov %ecx,0x4(%esp)
- .byte 139,77,8 // mov 0x8(%ebp),%ecx
- .byte 137,12,36 // mov %ecx,(%esp)
+ .byte 131,236,8 // sub $0x8,%esp
.byte 15,40,196 // movaps %xmm4,%xmm0
+ .byte 81 // push %ecx
+ .byte 255,117,8 // pushl 0x8(%ebp)
.byte 255,16 // call *(%eax)
- .byte 129,196,156,0,0,0 // add $0x9c,%esp
+ .byte 131,196,76 // add $0x4c,%esp
.byte 94 // pop %esi
.byte 95 // pop %edi
.byte 91 // pop %ebx
@@ -58973,60 +56950,40 @@ FUNCTION(_sk_evenly_spaced_2_stop_gradient_sse2)
_sk_evenly_spaced_2_stop_gradient_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
+ .byte 131,236,8 // sub $0x8,%esp
.byte 15,40,224 // movaps %xmm0,%xmm4
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
- .byte 139,117,20 // mov 0x14(%ebp),%esi
- .byte 139,85,12 // mov 0xc(%ebp),%edx
- .byte 139,58 // mov (%edx),%edi
- .byte 243,15,16,7 // movss (%edi),%xmm0
- .byte 243,15,16,79,4 // movss 0x4(%edi),%xmm1
+ .byte 139,69,12 // mov 0xc(%ebp),%eax
+ .byte 139,8 // mov (%eax),%ecx
+ .byte 243,15,16,1 // movss (%ecx),%xmm0
+ .byte 243,15,16,73,4 // movss 0x4(%ecx),%xmm1
.byte 15,198,192,0 // shufps $0x0,%xmm0,%xmm0
- .byte 243,15,16,87,16 // movss 0x10(%edi),%xmm2
+ .byte 243,15,16,81,16 // movss 0x10(%ecx),%xmm2
.byte 15,198,210,0 // shufps $0x0,%xmm2,%xmm2
.byte 15,89,196 // mulps %xmm4,%xmm0
.byte 15,88,194 // addps %xmm2,%xmm0
- .byte 243,15,16,111,20 // movss 0x14(%edi),%xmm5
- .byte 243,15,16,87,8 // movss 0x8(%edi),%xmm2
- .byte 243,15,16,119,24 // movss 0x18(%edi),%xmm6
- .byte 243,15,16,95,12 // movss 0xc(%edi),%xmm3
- .byte 243,15,16,127,28 // movss 0x1c(%edi),%xmm7
- .byte 139,125,24 // mov 0x18(%ebp),%edi
.byte 15,198,201,0 // shufps $0x0,%xmm1,%xmm1
- .byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
+ .byte 243,15,16,81,20 // movss 0x14(%ecx),%xmm2
+ .byte 15,198,210,0 // shufps $0x0,%xmm2,%xmm2
.byte 15,89,204 // mulps %xmm4,%xmm1
- .byte 15,88,205 // addps %xmm5,%xmm1
- .byte 15,40,109,40 // movaps 0x28(%ebp),%xmm5
+ .byte 15,88,202 // addps %xmm2,%xmm1
+ .byte 243,15,16,81,8 // movss 0x8(%ecx),%xmm2
.byte 15,198,210,0 // shufps $0x0,%xmm2,%xmm2
- .byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6
+ .byte 243,15,16,89,24 // movss 0x18(%ecx),%xmm3
+ .byte 15,198,219,0 // shufps $0x0,%xmm3,%xmm3
.byte 15,89,212 // mulps %xmm4,%xmm2
- .byte 15,88,214 // addps %xmm6,%xmm2
- .byte 15,40,117,56 // movaps 0x38(%ebp),%xmm6
+ .byte 15,88,211 // addps %xmm3,%xmm2
+ .byte 243,15,16,89,12 // movss 0xc(%ecx),%xmm3
.byte 15,198,219,0 // shufps $0x0,%xmm3,%xmm3
+ .byte 243,15,16,105,28 // movss 0x1c(%ecx),%xmm5
+ .byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
.byte 15,89,220 // mulps %xmm4,%xmm3
- .byte 15,40,101,72 // movaps 0x48(%ebp),%xmm4
- .byte 15,198,255,0 // shufps $0x0,%xmm7,%xmm7
- .byte 15,88,223 // addps %xmm7,%xmm3
- .byte 15,40,125,88 // movaps 0x58(%ebp),%xmm7
- .byte 141,90,8 // lea 0x8(%edx),%ebx
- .byte 15,41,124,36,80 // movaps %xmm7,0x50(%esp)
- .byte 15,41,100,36,64 // movaps %xmm4,0x40(%esp)
- .byte 15,41,116,36,48 // movaps %xmm6,0x30(%esp)
- .byte 15,41,108,36,32 // movaps %xmm5,0x20(%esp)
- .byte 137,124,36,16 // mov %edi,0x10(%esp)
- .byte 137,116,36,12 // mov %esi,0xc(%esp)
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
- .byte 255,82,4 // call *0x4(%edx)
- .byte 131,196,108 // add $0x6c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 15,88,221 // addps %xmm5,%xmm3
+ .byte 141,72,8 // lea 0x8(%eax),%ecx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 81 // push %ecx
+ .byte 255,117,8 // pushl 0x8(%ebp)
+ .byte 255,80,4 // call *0x4(%eax)
+ .byte 131,196,24 // add $0x18,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -59036,15 +56993,12 @@ FUNCTION(_sk_xy_to_unit_angle_sse2)
_sk_xy_to_unit_angle_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 131,236,124 // sub $0x7c,%esp
- .byte 15,41,93,216 // movaps %xmm3,-0x28(%ebp)
+ .byte 131,236,24 // sub $0x18,%esp
+ .byte 15,41,93,232 // movaps %xmm3,-0x18(%ebp)
.byte 15,40,218 // movaps %xmm2,%xmm3
.byte 15,40,209 // movaps %xmm1,%xmm2
.byte 15,40,200 // movaps %xmm0,%xmm1
- .byte 232,0,0,0,0 // call 835e <_sk_xy_to_unit_angle_sse2+0x1b>
+ .byte 232,0,0,0,0 // call 65ff <_sk_xy_to_unit_angle_sse2+0x18>
.byte 88 // pop %eax
.byte 15,87,237 // xorps %xmm5,%xmm5
.byte 15,92,233 // subps %xmm1,%xmm5
@@ -59059,64 +57013,47 @@ _sk_xy_to_unit_angle_sse2:
.byte 15,94,247 // divps %xmm7,%xmm6
.byte 15,40,254 // movaps %xmm6,%xmm7
.byte 15,89,255 // mulps %xmm7,%xmm7
- .byte 15,40,128,146,31,0,0 // movaps 0x1f92(%eax),%xmm0
+ .byte 15,40,128,1,26,0,0 // movaps 0x1a01(%eax),%xmm0
.byte 15,89,199 // mulps %xmm7,%xmm0
- .byte 15,88,128,162,31,0,0 // addps 0x1fa2(%eax),%xmm0
+ .byte 15,88,128,17,26,0,0 // addps 0x1a11(%eax),%xmm0
.byte 15,89,199 // mulps %xmm7,%xmm0
- .byte 15,88,128,178,31,0,0 // addps 0x1fb2(%eax),%xmm0
+ .byte 15,88,128,33,26,0,0 // addps 0x1a21(%eax),%xmm0
.byte 15,89,199 // mulps %xmm7,%xmm0
- .byte 139,77,8 // mov 0x8(%ebp),%ecx
- .byte 139,85,16 // mov 0x10(%ebp),%edx
- .byte 139,117,20 // mov 0x14(%ebp),%esi
- .byte 139,125,24 // mov 0x18(%ebp),%edi
- .byte 15,88,128,194,31,0,0 // addps 0x1fc2(%eax),%xmm0
+ .byte 15,88,128,49,26,0,0 // addps 0x1a31(%eax),%xmm0
.byte 15,89,198 // mulps %xmm6,%xmm0
- .byte 15,40,117,40 // movaps 0x28(%ebp),%xmm6
.byte 15,194,236,1 // cmpltps %xmm4,%xmm5
- .byte 15,40,184,210,31,0,0 // movaps 0x1fd2(%eax),%xmm7
- .byte 15,92,248 // subps %xmm0,%xmm7
- .byte 15,84,253 // andps %xmm5,%xmm7
+ .byte 15,40,176,65,26,0,0 // movaps 0x1a41(%eax),%xmm6
+ .byte 15,92,240 // subps %xmm0,%xmm6
+ .byte 15,84,245 // andps %xmm5,%xmm6
.byte 15,85,232 // andnps %xmm0,%xmm5
.byte 15,87,228 // xorps %xmm4,%xmm4
- .byte 15,86,239 // orps %xmm7,%xmm5
+ .byte 15,86,238 // orps %xmm6,%xmm5
.byte 15,194,204,1 // cmpltps %xmm4,%xmm1
- .byte 15,40,128,226,31,0,0 // movaps 0x1fe2(%eax),%xmm0
+ .byte 15,40,128,81,26,0,0 // movaps 0x1a51(%eax),%xmm0
.byte 15,92,197 // subps %xmm5,%xmm0
.byte 15,84,193 // andps %xmm1,%xmm0
.byte 15,85,205 // andnps %xmm5,%xmm1
.byte 15,86,200 // orps %xmm0,%xmm1
.byte 15,40,194 // movaps %xmm2,%xmm0
.byte 15,194,196,1 // cmpltps %xmm4,%xmm0
- .byte 15,40,168,242,31,0,0 // movaps 0x1ff2(%eax),%xmm5
+ .byte 15,40,168,97,26,0,0 // movaps 0x1a61(%eax),%xmm5
.byte 15,92,233 // subps %xmm1,%xmm5
.byte 15,84,232 // andps %xmm0,%xmm5
.byte 15,85,193 // andnps %xmm1,%xmm0
- .byte 15,40,77,56 // movaps 0x38(%ebp),%xmm1
.byte 15,86,197 // orps %xmm5,%xmm0
- .byte 15,40,109,72 // movaps 0x48(%ebp),%xmm5
.byte 15,194,224,7 // cmpordps %xmm0,%xmm4
.byte 15,84,224 // andps %xmm0,%xmm4
- .byte 15,40,69,88 // movaps 0x58(%ebp),%xmm0
.byte 139,69,12 // mov 0xc(%ebp),%eax
- .byte 141,88,4 // lea 0x4(%eax),%ebx
- .byte 15,41,68,36,80 // movaps %xmm0,0x50(%esp)
- .byte 15,41,108,36,64 // movaps %xmm5,0x40(%esp)
- .byte 15,41,76,36,48 // movaps %xmm1,0x30(%esp)
- .byte 15,41,116,36,32 // movaps %xmm6,0x20(%esp)
- .byte 137,124,36,16 // mov %edi,0x10(%esp)
- .byte 137,116,36,12 // mov %esi,0xc(%esp)
- .byte 137,84,36,8 // mov %edx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,12,36 // mov %ecx,(%esp)
+ .byte 141,72,4 // lea 0x4(%eax),%ecx
+ .byte 131,236,8 // sub $0x8,%esp
.byte 15,40,196 // movaps %xmm4,%xmm0
.byte 15,40,202 // movaps %xmm2,%xmm1
.byte 15,40,211 // movaps %xmm3,%xmm2
- .byte 15,40,93,216 // movaps -0x28(%ebp),%xmm3
+ .byte 15,40,93,232 // movaps -0x18(%ebp),%xmm3
+ .byte 81 // push %ecx
+ .byte 255,117,8 // pushl 0x8(%ebp)
.byte 255,16 // call *(%eax)
- .byte 131,196,124 // add $0x7c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 131,196,40 // add $0x28,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -59126,39 +57063,19 @@ FUNCTION(_sk_xy_to_radius_sse2)
_sk_xy_to_radius_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
- .byte 139,85,20 // mov 0x14(%ebp),%edx
- .byte 139,117,24 // mov 0x18(%ebp),%esi
- .byte 15,40,109,56 // movaps 0x38(%ebp),%xmm5
- .byte 15,40,117,72 // movaps 0x48(%ebp),%xmm6
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 15,89,192 // mulps %xmm0,%xmm0
- .byte 15,40,249 // movaps %xmm1,%xmm7
- .byte 15,89,255 // mulps %xmm7,%xmm7
- .byte 15,88,248 // addps %xmm0,%xmm7
- .byte 15,40,101,88 // movaps 0x58(%ebp),%xmm4
- .byte 139,125,12 // mov 0xc(%ebp),%edi
- .byte 15,81,199 // sqrtps %xmm7,%xmm0
- .byte 141,95,4 // lea 0x4(%edi),%ebx
- .byte 15,41,100,36,80 // movaps %xmm4,0x50(%esp)
- .byte 15,41,116,36,64 // movaps %xmm6,0x40(%esp)
- .byte 15,41,108,36,48 // movaps %xmm5,0x30(%esp)
- .byte 15,40,101,40 // movaps 0x28(%ebp),%xmm4
- .byte 15,41,100,36,32 // movaps %xmm4,0x20(%esp)
- .byte 137,116,36,16 // mov %esi,0x10(%esp)
- .byte 137,84,36,12 // mov %edx,0xc(%esp)
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
- .byte 255,23 // call *(%edi)
- .byte 131,196,108 // add $0x6c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 15,40,225 // movaps %xmm1,%xmm4
+ .byte 15,89,228 // mulps %xmm4,%xmm4
+ .byte 15,88,224 // addps %xmm0,%xmm4
+ .byte 15,81,196 // sqrtps %xmm4,%xmm0
+ .byte 141,72,4 // lea 0x4(%eax),%ecx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 81 // push %ecx
+ .byte 255,117,8 // pushl 0x8(%ebp)
+ .byte 255,16 // call *(%eax)
+ .byte 131,196,24 // add $0x18,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -59168,74 +57085,48 @@ FUNCTION(_sk_xy_to_2pt_conical_quadratic_max_sse2)
_sk_xy_to_2pt_conical_quadratic_max_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 131,236,124 // sub $0x7c,%esp
- .byte 15,41,93,216 // movaps %xmm3,-0x28(%ebp)
- .byte 15,40,218 // movaps %xmm2,%xmm3
- .byte 15,40,209 // movaps %xmm1,%xmm2
- .byte 232,0,0,0,0 // call 84e3 <_sk_xy_to_2pt_conical_quadratic_max_sse2+0x18>
- .byte 94 // pop %esi
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
- .byte 139,85,12 // mov 0xc(%ebp),%edx
- .byte 139,58 // mov (%edx),%edi
- .byte 243,15,16,111,32 // movss 0x20(%edi),%xmm5
- .byte 243,15,16,119,40 // movss 0x28(%edi),%xmm6
- .byte 243,15,16,103,44 // movss 0x2c(%edi),%xmm4
- .byte 243,15,89,230 // mulss %xmm6,%xmm4
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 139,69,12 // mov 0xc(%ebp),%eax
+ .byte 139,8 // mov (%eax),%ecx
+ .byte 243,15,16,105,40 // movss 0x28(%ecx),%xmm5
+ .byte 243,15,16,97,44 // movss 0x2c(%ecx),%xmm4
+ .byte 243,15,89,229 // mulss %xmm5,%xmm4
.byte 15,198,228,0 // shufps $0x0,%xmm4,%xmm4
.byte 15,88,224 // addps %xmm0,%xmm4
.byte 15,89,192 // mulps %xmm0,%xmm0
- .byte 15,40,250 // movaps %xmm2,%xmm7
- .byte 15,89,255 // mulps %xmm7,%xmm7
- .byte 15,88,248 // addps %xmm0,%xmm7
- .byte 243,15,16,79,36 // movss 0x24(%edi),%xmm1
- .byte 139,125,20 // mov 0x14(%ebp),%edi
+ .byte 15,40,241 // movaps %xmm1,%xmm6
+ .byte 15,89,246 // mulps %xmm6,%xmm6
+ .byte 15,88,240 // addps %xmm0,%xmm6
+ .byte 232,0,0,0,0 // call 671c <_sk_xy_to_2pt_conical_quadratic_max_sse2+0x31>
+ .byte 90 // pop %edx
+ .byte 243,15,89,237 // mulss %xmm5,%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
- .byte 15,89,166,125,30,0,0 // mulps 0x1e7d(%esi),%xmm4
- .byte 243,15,89,246 // mulss %xmm6,%xmm6
- .byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6
- .byte 15,92,254 // subps %xmm6,%xmm7
- .byte 15,89,174,141,30,0,0 // mulps 0x1e8d(%esi),%xmm5
- .byte 15,89,239 // mulps %xmm7,%xmm5
- .byte 15,40,196 // movaps %xmm4,%xmm0
- .byte 15,89,192 // mulps %xmm0,%xmm0
- .byte 15,88,197 // addps %xmm5,%xmm0
- .byte 15,81,232 // sqrtps %xmm0,%xmm5
- .byte 15,198,201,0 // shufps $0x0,%xmm1,%xmm1
+ .byte 15,92,245 // subps %xmm5,%xmm6
+ .byte 243,15,16,65,32 // movss 0x20(%ecx),%xmm0
+ .byte 15,198,192,0 // shufps $0x0,%xmm0,%xmm0
+ .byte 15,89,162,84,25,0,0 // mulps 0x1954(%edx),%xmm4
+ .byte 15,89,130,100,25,0,0 // mulps 0x1964(%edx),%xmm0
+ .byte 15,89,198 // mulps %xmm6,%xmm0
+ .byte 15,40,236 // movaps %xmm4,%xmm5
+ .byte 15,89,237 // mulps %xmm5,%xmm5
+ .byte 15,88,232 // addps %xmm0,%xmm5
+ .byte 15,81,237 // sqrtps %xmm5,%xmm5
.byte 15,40,197 // movaps %xmm5,%xmm0
.byte 15,92,196 // subps %xmm4,%xmm0
- .byte 15,87,166,157,30,0,0 // xorps 0x1e9d(%esi),%xmm4
- .byte 15,89,142,173,30,0,0 // mulps 0x1ead(%esi),%xmm1
- .byte 139,117,24 // mov 0x18(%ebp),%esi
- .byte 15,40,117,40 // movaps 0x28(%ebp),%xmm6
+ .byte 15,87,162,116,25,0,0 // xorps 0x1974(%edx),%xmm4
.byte 15,92,229 // subps %xmm5,%xmm4
- .byte 15,40,109,56 // movaps 0x38(%ebp),%xmm5
- .byte 15,89,193 // mulps %xmm1,%xmm0
- .byte 15,89,225 // mulps %xmm1,%xmm4
- .byte 15,40,77,72 // movaps 0x48(%ebp),%xmm1
+ .byte 243,15,16,105,36 // movss 0x24(%ecx),%xmm5
+ .byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
+ .byte 15,89,170,132,25,0,0 // mulps 0x1984(%edx),%xmm5
+ .byte 15,89,197 // mulps %xmm5,%xmm0
+ .byte 15,89,229 // mulps %xmm5,%xmm4
.byte 15,95,196 // maxps %xmm4,%xmm0
- .byte 15,40,101,88 // movaps 0x58(%ebp),%xmm4
- .byte 141,90,8 // lea 0x8(%edx),%ebx
- .byte 15,41,100,36,80 // movaps %xmm4,0x50(%esp)
- .byte 15,41,76,36,64 // movaps %xmm1,0x40(%esp)
- .byte 15,41,108,36,48 // movaps %xmm5,0x30(%esp)
- .byte 15,41,116,36,32 // movaps %xmm6,0x20(%esp)
- .byte 137,116,36,16 // mov %esi,0x10(%esp)
- .byte 137,124,36,12 // mov %edi,0xc(%esp)
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
- .byte 15,40,202 // movaps %xmm2,%xmm1
- .byte 15,40,211 // movaps %xmm3,%xmm2
- .byte 15,40,93,216 // movaps -0x28(%ebp),%xmm3
- .byte 255,82,4 // call *0x4(%edx)
- .byte 131,196,124 // add $0x7c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 141,72,8 // lea 0x8(%eax),%ecx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 81 // push %ecx
+ .byte 255,117,8 // pushl 0x8(%ebp)
+ .byte 255,80,4 // call *0x4(%eax)
+ .byte 131,196,24 // add $0x18,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -59245,74 +57136,48 @@ FUNCTION(_sk_xy_to_2pt_conical_quadratic_min_sse2)
_sk_xy_to_2pt_conical_quadratic_min_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 131,236,124 // sub $0x7c,%esp
- .byte 15,41,93,216 // movaps %xmm3,-0x28(%ebp)
- .byte 15,40,218 // movaps %xmm2,%xmm3
- .byte 15,40,209 // movaps %xmm1,%xmm2
- .byte 232,0,0,0,0 // call 85d7 <_sk_xy_to_2pt_conical_quadratic_min_sse2+0x18>
- .byte 94 // pop %esi
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
- .byte 139,85,12 // mov 0xc(%ebp),%edx
- .byte 139,58 // mov (%edx),%edi
- .byte 243,15,16,111,32 // movss 0x20(%edi),%xmm5
- .byte 243,15,16,119,40 // movss 0x28(%edi),%xmm6
- .byte 243,15,16,103,44 // movss 0x2c(%edi),%xmm4
- .byte 243,15,89,230 // mulss %xmm6,%xmm4
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 139,69,12 // mov 0xc(%ebp),%eax
+ .byte 139,8 // mov (%eax),%ecx
+ .byte 243,15,16,105,40 // movss 0x28(%ecx),%xmm5
+ .byte 243,15,16,97,44 // movss 0x2c(%ecx),%xmm4
+ .byte 243,15,89,229 // mulss %xmm5,%xmm4
.byte 15,198,228,0 // shufps $0x0,%xmm4,%xmm4
.byte 15,88,224 // addps %xmm0,%xmm4
.byte 15,89,192 // mulps %xmm0,%xmm0
- .byte 15,40,250 // movaps %xmm2,%xmm7
- .byte 15,89,255 // mulps %xmm7,%xmm7
- .byte 15,88,248 // addps %xmm0,%xmm7
- .byte 243,15,16,79,36 // movss 0x24(%edi),%xmm1
- .byte 139,125,20 // mov 0x14(%ebp),%edi
+ .byte 15,40,241 // movaps %xmm1,%xmm6
+ .byte 15,89,246 // mulps %xmm6,%xmm6
+ .byte 15,88,240 // addps %xmm0,%xmm6
+ .byte 232,0,0,0,0 // call 67ba <_sk_xy_to_2pt_conical_quadratic_min_sse2+0x31>
+ .byte 90 // pop %edx
+ .byte 243,15,89,237 // mulss %xmm5,%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
- .byte 15,89,166,201,29,0,0 // mulps 0x1dc9(%esi),%xmm4
- .byte 243,15,89,246 // mulss %xmm6,%xmm6
- .byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6
- .byte 15,92,254 // subps %xmm6,%xmm7
- .byte 15,89,174,217,29,0,0 // mulps 0x1dd9(%esi),%xmm5
- .byte 15,89,239 // mulps %xmm7,%xmm5
- .byte 15,40,196 // movaps %xmm4,%xmm0
- .byte 15,89,192 // mulps %xmm0,%xmm0
- .byte 15,88,197 // addps %xmm5,%xmm0
- .byte 15,81,232 // sqrtps %xmm0,%xmm5
- .byte 15,198,201,0 // shufps $0x0,%xmm1,%xmm1
+ .byte 15,92,245 // subps %xmm5,%xmm6
+ .byte 243,15,16,65,32 // movss 0x20(%ecx),%xmm0
+ .byte 15,198,192,0 // shufps $0x0,%xmm0,%xmm0
+ .byte 15,89,162,246,24,0,0 // mulps 0x18f6(%edx),%xmm4
+ .byte 15,89,130,6,25,0,0 // mulps 0x1906(%edx),%xmm0
+ .byte 15,89,198 // mulps %xmm6,%xmm0
+ .byte 15,40,236 // movaps %xmm4,%xmm5
+ .byte 15,89,237 // mulps %xmm5,%xmm5
+ .byte 15,88,232 // addps %xmm0,%xmm5
+ .byte 15,81,237 // sqrtps %xmm5,%xmm5
.byte 15,40,197 // movaps %xmm5,%xmm0
.byte 15,92,196 // subps %xmm4,%xmm0
- .byte 15,87,166,233,29,0,0 // xorps 0x1de9(%esi),%xmm4
- .byte 15,89,142,249,29,0,0 // mulps 0x1df9(%esi),%xmm1
- .byte 139,117,24 // mov 0x18(%ebp),%esi
- .byte 15,40,117,40 // movaps 0x28(%ebp),%xmm6
+ .byte 15,87,162,22,25,0,0 // xorps 0x1916(%edx),%xmm4
.byte 15,92,229 // subps %xmm5,%xmm4
- .byte 15,40,109,56 // movaps 0x38(%ebp),%xmm5
- .byte 15,89,193 // mulps %xmm1,%xmm0
- .byte 15,89,225 // mulps %xmm1,%xmm4
- .byte 15,40,77,72 // movaps 0x48(%ebp),%xmm1
+ .byte 243,15,16,105,36 // movss 0x24(%ecx),%xmm5
+ .byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
+ .byte 15,89,170,38,25,0,0 // mulps 0x1926(%edx),%xmm5
+ .byte 15,89,197 // mulps %xmm5,%xmm0
+ .byte 15,89,229 // mulps %xmm5,%xmm4
.byte 15,93,196 // minps %xmm4,%xmm0
- .byte 15,40,101,88 // movaps 0x58(%ebp),%xmm4
- .byte 141,90,8 // lea 0x8(%edx),%ebx
- .byte 15,41,100,36,80 // movaps %xmm4,0x50(%esp)
- .byte 15,41,76,36,64 // movaps %xmm1,0x40(%esp)
- .byte 15,41,108,36,48 // movaps %xmm5,0x30(%esp)
- .byte 15,41,116,36,32 // movaps %xmm6,0x20(%esp)
- .byte 137,116,36,16 // mov %esi,0x10(%esp)
- .byte 137,124,36,12 // mov %edi,0xc(%esp)
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
- .byte 15,40,202 // movaps %xmm2,%xmm1
- .byte 15,40,211 // movaps %xmm3,%xmm2
- .byte 15,40,93,216 // movaps -0x28(%ebp),%xmm3
- .byte 255,82,4 // call *0x4(%edx)
- .byte 131,196,124 // add $0x7c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 141,72,8 // lea 0x8(%eax),%ecx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 81 // push %ecx
+ .byte 255,117,8 // pushl 0x8(%ebp)
+ .byte 255,80,4 // call *0x4(%eax)
+ .byte 131,196,24 // add $0x18,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -59322,23 +57187,17 @@ FUNCTION(_sk_xy_to_2pt_conical_linear_sse2)
_sk_xy_to_2pt_conical_linear_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 232,0,0,0,0 // call 86c1 <_sk_xy_to_2pt_conical_linear_sse2+0xe>
- .byte 94 // pop %esi
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
- .byte 139,85,12 // mov 0xc(%ebp),%edx
- .byte 139,58 // mov (%edx),%edi
- .byte 243,15,16,103,40 // movss 0x28(%edi),%xmm4
- .byte 243,15,16,111,44 // movss 0x2c(%edi),%xmm5
- .byte 139,125,20 // mov 0x14(%ebp),%edi
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 232,0,0,0,0 // call 6832 <_sk_xy_to_2pt_conical_linear_sse2+0xb>
+ .byte 89 // pop %ecx
+ .byte 139,69,12 // mov 0xc(%ebp),%eax
+ .byte 139,16 // mov (%eax),%edx
+ .byte 243,15,16,98,40 // movss 0x28(%edx),%xmm4
+ .byte 243,15,16,106,44 // movss 0x2c(%edx),%xmm5
.byte 243,15,89,236 // mulss %xmm4,%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
.byte 15,88,232 // addps %xmm0,%xmm5
- .byte 15,89,174,31,29,0,0 // mulps 0x1d1f(%esi),%xmm5
+ .byte 15,89,169,190,24,0,0 // mulps 0x18be(%ecx),%xmm5
.byte 15,89,192 // mulps %xmm0,%xmm0
.byte 15,40,241 // movaps %xmm1,%xmm6
.byte 15,89,246 // mulps %xmm6,%xmm6
@@ -59346,28 +57205,14 @@ _sk_xy_to_2pt_conical_linear_sse2:
.byte 243,15,89,228 // mulss %xmm4,%xmm4
.byte 15,198,228,0 // shufps $0x0,%xmm4,%xmm4
.byte 15,92,196 // subps %xmm4,%xmm0
- .byte 15,87,134,47,29,0,0 // xorps 0x1d2f(%esi),%xmm0
- .byte 139,117,24 // mov 0x18(%ebp),%esi
- .byte 15,40,101,40 // movaps 0x28(%ebp),%xmm4
- .byte 15,40,117,56 // movaps 0x38(%ebp),%xmm6
- .byte 15,40,125,72 // movaps 0x48(%ebp),%xmm7
+ .byte 15,87,129,206,24,0,0 // xorps 0x18ce(%ecx),%xmm0
.byte 15,94,197 // divps %xmm5,%xmm0
- .byte 15,40,109,88 // movaps 0x58(%ebp),%xmm5
- .byte 141,90,8 // lea 0x8(%edx),%ebx
- .byte 15,41,108,36,80 // movaps %xmm5,0x50(%esp)
- .byte 15,41,124,36,64 // movaps %xmm7,0x40(%esp)
- .byte 15,41,116,36,48 // movaps %xmm6,0x30(%esp)
- .byte 15,41,100,36,32 // movaps %xmm4,0x20(%esp)
- .byte 137,116,36,16 // mov %esi,0x10(%esp)
- .byte 137,124,36,12 // mov %edi,0xc(%esp)
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
- .byte 255,82,4 // call *0x4(%edx)
- .byte 131,196,108 // add $0x6c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 141,72,8 // lea 0x8(%eax),%ecx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 81 // push %ecx
+ .byte 255,117,8 // pushl 0x8(%ebp)
+ .byte 255,80,4 // call *0x4(%eax)
+ .byte 131,196,24 // add $0x18,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -59377,17 +57222,12 @@ FUNCTION(_sk_mask_2pt_conical_degenerates_sse2)
_sk_mask_2pt_conical_degenerates_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
+ .byte 131,236,8 // sub $0x8,%esp
.byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
- .byte 139,117,20 // mov 0x14(%ebp),%esi
- .byte 139,85,12 // mov 0xc(%ebp),%edx
- .byte 139,58 // mov (%edx),%edi
- .byte 243,15,16,103,40 // movss 0x28(%edi),%xmm4
- .byte 243,15,16,111,44 // movss 0x2c(%edi),%xmm5
+ .byte 139,77,12 // mov 0xc(%ebp),%ecx
+ .byte 139,17 // mov (%ecx),%edx
+ .byte 243,15,16,98,40 // movss 0x28(%edx),%xmm4
+ .byte 243,15,16,106,44 // movss 0x2c(%edx),%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
.byte 15,198,228,0 // shufps $0x0,%xmm4,%xmm4
.byte 15,89,232 // mulps %xmm0,%xmm5
@@ -59397,27 +57237,13 @@ _sk_mask_2pt_conical_degenerates_sse2:
.byte 15,194,244,7 // cmpordps %xmm4,%xmm6
.byte 15,194,229,2 // cmpleps %xmm5,%xmm4
.byte 15,84,230 // andps %xmm6,%xmm4
- .byte 15,17,39 // movups %xmm4,(%edi)
- .byte 139,125,24 // mov 0x18(%ebp),%edi
- .byte 15,40,101,40 // movaps 0x28(%ebp),%xmm4
- .byte 15,40,109,56 // movaps 0x38(%ebp),%xmm5
- .byte 15,40,117,72 // movaps 0x48(%ebp),%xmm6
- .byte 15,40,125,88 // movaps 0x58(%ebp),%xmm7
- .byte 141,90,8 // lea 0x8(%edx),%ebx
- .byte 15,41,124,36,80 // movaps %xmm7,0x50(%esp)
- .byte 15,41,116,36,64 // movaps %xmm6,0x40(%esp)
- .byte 15,41,108,36,48 // movaps %xmm5,0x30(%esp)
- .byte 15,41,100,36,32 // movaps %xmm4,0x20(%esp)
- .byte 137,124,36,16 // mov %edi,0x10(%esp)
- .byte 137,116,36,12 // mov %esi,0xc(%esp)
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
- .byte 255,82,4 // call *0x4(%edx)
- .byte 131,196,108 // add $0x6c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 15,17,34 // movups %xmm4,(%edx)
+ .byte 141,81,8 // lea 0x8(%ecx),%edx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 82 // push %edx
+ .byte 80 // push %eax
+ .byte 255,81,4 // call *0x4(%ecx)
+ .byte 131,196,24 // add $0x18,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -59427,40 +57253,20 @@ FUNCTION(_sk_apply_vector_mask_sse2)
_sk_apply_vector_mask_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
- .byte 139,85,20 // mov 0x14(%ebp),%edx
- .byte 139,117,12 // mov 0xc(%ebp),%esi
- .byte 139,62 // mov (%esi),%edi
- .byte 15,16,39 // movups (%edi),%xmm4
- .byte 139,125,24 // mov 0x18(%ebp),%edi
- .byte 15,40,109,40 // movaps 0x28(%ebp),%xmm5
- .byte 15,40,117,56 // movaps 0x38(%ebp),%xmm6
- .byte 15,40,125,72 // movaps 0x48(%ebp),%xmm7
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 139,69,12 // mov 0xc(%ebp),%eax
+ .byte 139,8 // mov (%eax),%ecx
+ .byte 15,16,33 // movups (%ecx),%xmm4
.byte 15,84,196 // andps %xmm4,%xmm0
.byte 15,84,204 // andps %xmm4,%xmm1
.byte 15,84,212 // andps %xmm4,%xmm2
.byte 15,84,220 // andps %xmm4,%xmm3
- .byte 15,40,101,88 // movaps 0x58(%ebp),%xmm4
- .byte 141,94,8 // lea 0x8(%esi),%ebx
- .byte 15,41,100,36,80 // movaps %xmm4,0x50(%esp)
- .byte 15,41,124,36,64 // movaps %xmm7,0x40(%esp)
- .byte 15,41,116,36,48 // movaps %xmm6,0x30(%esp)
- .byte 15,41,108,36,32 // movaps %xmm5,0x20(%esp)
- .byte 137,124,36,16 // mov %edi,0x10(%esp)
- .byte 137,84,36,12 // mov %edx,0xc(%esp)
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
- .byte 255,86,4 // call *0x4(%esi)
- .byte 131,196,108 // add $0x6c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 141,72,8 // lea 0x8(%eax),%ecx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 81 // push %ecx
+ .byte 255,117,8 // pushl 0x8(%ebp)
+ .byte 255,80,4 // call *0x4(%eax)
+ .byte 131,196,24 // add $0x18,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -59470,22 +57276,19 @@ FUNCTION(_sk_save_xy_sse2)
_sk_save_xy_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 131,236,124 // sub $0x7c,%esp
- .byte 15,41,93,216 // movaps %xmm3,-0x28(%ebp)
+ .byte 131,236,24 // sub $0x18,%esp
+ .byte 15,41,93,232 // movaps %xmm3,-0x18(%ebp)
.byte 15,40,218 // movaps %xmm2,%xmm3
- .byte 232,0,0,0,0 // call 8863 <_sk_save_xy_sse2+0x15>
+ .byte 232,0,0,0,0 // call 690f <_sk_save_xy_sse2+0x12>
.byte 88 // pop %eax
- .byte 15,40,160,157,27,0,0 // movaps 0x1b9d(%eax),%xmm4
+ .byte 15,40,160,1,24,0,0 // movaps 0x1801(%eax),%xmm4
.byte 15,40,232 // movaps %xmm0,%xmm5
.byte 15,88,236 // addps %xmm4,%xmm5
.byte 243,15,91,245 // cvttps2dq %xmm5,%xmm6
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
.byte 15,40,253 // movaps %xmm5,%xmm7
.byte 15,194,254,1 // cmpltps %xmm6,%xmm7
- .byte 15,40,144,173,27,0,0 // movaps 0x1bad(%eax),%xmm2
+ .byte 15,40,144,17,24,0,0 // movaps 0x1811(%eax),%xmm2
.byte 15,84,250 // andps %xmm2,%xmm7
.byte 15,92,247 // subps %xmm7,%xmm6
.byte 15,92,238 // subps %xmm6,%xmm5
@@ -59495,39 +57298,23 @@ _sk_save_xy_sse2:
.byte 15,40,252 // movaps %xmm4,%xmm7
.byte 15,194,254,1 // cmpltps %xmm6,%xmm7
.byte 15,84,250 // andps %xmm2,%xmm7
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
- .byte 139,85,20 // mov 0x14(%ebp),%edx
- .byte 139,117,12 // mov 0xc(%ebp),%esi
- .byte 139,62 // mov (%esi),%edi
.byte 15,92,247 // subps %xmm7,%xmm6
.byte 15,92,230 // subps %xmm6,%xmm4
- .byte 15,17,7 // movups %xmm0,(%edi)
- .byte 15,17,79,32 // movups %xmm1,0x20(%edi)
- .byte 15,17,111,64 // movups %xmm5,0x40(%edi)
- .byte 15,17,103,96 // movups %xmm4,0x60(%edi)
- .byte 139,125,24 // mov 0x18(%ebp),%edi
- .byte 15,40,85,40 // movaps 0x28(%ebp),%xmm2
- .byte 15,40,101,56 // movaps 0x38(%ebp),%xmm4
- .byte 15,40,109,72 // movaps 0x48(%ebp),%xmm5
- .byte 15,40,117,88 // movaps 0x58(%ebp),%xmm6
- .byte 141,94,8 // lea 0x8(%esi),%ebx
- .byte 15,41,116,36,80 // movaps %xmm6,0x50(%esp)
- .byte 15,41,108,36,64 // movaps %xmm5,0x40(%esp)
- .byte 15,41,100,36,48 // movaps %xmm4,0x30(%esp)
- .byte 15,41,84,36,32 // movaps %xmm2,0x20(%esp)
- .byte 137,124,36,16 // mov %edi,0x10(%esp)
- .byte 137,84,36,12 // mov %edx,0xc(%esp)
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
+ .byte 139,69,12 // mov 0xc(%ebp),%eax
+ .byte 139,8 // mov (%eax),%ecx
+ .byte 15,17,1 // movups %xmm0,(%ecx)
+ .byte 15,17,73,32 // movups %xmm1,0x20(%ecx)
+ .byte 15,17,105,64 // movups %xmm5,0x40(%ecx)
+ .byte 15,17,97,96 // movups %xmm4,0x60(%ecx)
+ .byte 139,77,8 // mov 0x8(%ebp),%ecx
+ .byte 141,80,8 // lea 0x8(%eax),%edx
+ .byte 131,236,8 // sub $0x8,%esp
.byte 15,40,211 // movaps %xmm3,%xmm2
- .byte 15,40,93,216 // movaps -0x28(%ebp),%xmm3
- .byte 255,86,4 // call *0x4(%esi)
- .byte 131,196,124 // add $0x7c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 15,40,93,232 // movaps -0x18(%ebp),%xmm3
+ .byte 82 // push %edx
+ .byte 81 // push %ecx
+ .byte 255,80,4 // call *0x4(%eax)
+ .byte 131,196,40 // add $0x28,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -59537,45 +57324,34 @@ FUNCTION(_sk_accumulate_sse2)
_sk_accumulate_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
- .byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 139,77,8 // mov 0x8(%ebp),%ecx
- .byte 139,85,16 // mov 0x10(%ebp),%edx
- .byte 139,117,20 // mov 0x14(%ebp),%esi
- .byte 139,69,12 // mov 0xc(%ebp),%eax
- .byte 139,56 // mov (%eax),%edi
- .byte 15,16,167,128,0,0,0 // movups 0x80(%edi),%xmm4
- .byte 15,16,175,160,0,0,0 // movups 0xa0(%edi),%xmm5
- .byte 139,125,24 // mov 0x18(%ebp),%edi
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 139,69,8 // mov 0x8(%ebp),%eax
+ .byte 139,77,12 // mov 0xc(%ebp),%ecx
+ .byte 139,17 // mov (%ecx),%edx
+ .byte 15,16,162,128,0,0,0 // movups 0x80(%edx),%xmm4
+ .byte 15,16,170,160,0,0,0 // movups 0xa0(%edx),%xmm5
.byte 15,89,236 // mulps %xmm4,%xmm5
.byte 15,40,229 // movaps %xmm5,%xmm4
.byte 15,89,224 // mulps %xmm0,%xmm4
- .byte 15,88,101,40 // addps 0x28(%ebp),%xmm4
- .byte 15,40,245 // movaps %xmm5,%xmm6
- .byte 15,89,241 // mulps %xmm1,%xmm6
- .byte 15,88,117,56 // addps 0x38(%ebp),%xmm6
- .byte 15,40,253 // movaps %xmm5,%xmm7
- .byte 15,89,250 // mulps %xmm2,%xmm7
- .byte 15,88,125,72 // addps 0x48(%ebp),%xmm7
+ .byte 15,88,96,16 // addps 0x10(%eax),%xmm4
+ .byte 15,41,96,16 // movaps %xmm4,0x10(%eax)
+ .byte 15,40,229 // movaps %xmm5,%xmm4
+ .byte 15,89,225 // mulps %xmm1,%xmm4
+ .byte 15,88,96,32 // addps 0x20(%eax),%xmm4
+ .byte 15,41,96,32 // movaps %xmm4,0x20(%eax)
+ .byte 15,40,229 // movaps %xmm5,%xmm4
+ .byte 15,89,226 // mulps %xmm2,%xmm4
+ .byte 15,88,96,48 // addps 0x30(%eax),%xmm4
+ .byte 15,41,96,48 // movaps %xmm4,0x30(%eax)
.byte 15,89,235 // mulps %xmm3,%xmm5
- .byte 15,88,109,88 // addps 0x58(%ebp),%xmm5
- .byte 141,88,8 // lea 0x8(%eax),%ebx
- .byte 137,124,36,16 // mov %edi,0x10(%esp)
- .byte 137,116,36,12 // mov %esi,0xc(%esp)
- .byte 137,84,36,8 // mov %edx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,12,36 // mov %ecx,(%esp)
- .byte 15,41,108,36,80 // movaps %xmm5,0x50(%esp)
- .byte 15,41,124,36,64 // movaps %xmm7,0x40(%esp)
- .byte 15,41,116,36,48 // movaps %xmm6,0x30(%esp)
- .byte 15,41,100,36,32 // movaps %xmm4,0x20(%esp)
- .byte 255,80,4 // call *0x4(%eax)
- .byte 131,196,108 // add $0x6c,%esp
- .byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
+ .byte 15,88,104,64 // addps 0x40(%eax),%xmm5
+ .byte 15,41,104,64 // movaps %xmm5,0x40(%eax)
+ .byte 141,81,8 // lea 0x8(%ecx),%edx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 82 // push %edx
+ .byte 80 // push %eax
+ .byte 255,81,4 // call *0x4(%ecx)
+ .byte 131,196,24 // add $0x18,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -59585,43 +57361,26 @@ FUNCTION(_sk_bilinear_nx_sse2)
_sk_bilinear_nx_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
.byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 232,0,0,0,0 // call 89a8 <_sk_bilinear_nx_sse2+0xe>
+ .byte 80 // push %eax
+ .byte 232,0,0,0,0 // call 69f1 <_sk_bilinear_nx_sse2+0xa>
.byte 88 // pop %eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
- .byte 139,85,16 // mov 0x10(%ebp),%edx
- .byte 139,117,12 // mov 0xc(%ebp),%esi
- .byte 139,62 // mov (%esi),%edi
- .byte 15,16,7 // movups (%edi),%xmm0
- .byte 15,88,128,120,26,0,0 // addps 0x1a78(%eax),%xmm0
- .byte 15,40,160,136,26,0,0 // movaps 0x1a88(%eax),%xmm4
- .byte 139,69,20 // mov 0x14(%ebp),%eax
- .byte 15,16,111,64 // movups 0x40(%edi),%xmm5
- .byte 15,92,229 // subps %xmm5,%xmm4
- .byte 15,17,167,128,0,0,0 // movups %xmm4,0x80(%edi)
- .byte 139,125,24 // mov 0x18(%ebp),%edi
- .byte 15,40,101,40 // movaps 0x28(%ebp),%xmm4
- .byte 15,40,109,56 // movaps 0x38(%ebp),%xmm5
- .byte 15,40,117,72 // movaps 0x48(%ebp),%xmm6
- .byte 15,40,125,88 // movaps 0x58(%ebp),%xmm7
- .byte 141,94,8 // lea 0x8(%esi),%ebx
- .byte 15,41,124,36,80 // movaps %xmm7,0x50(%esp)
- .byte 15,41,116,36,64 // movaps %xmm6,0x40(%esp)
- .byte 15,41,108,36,48 // movaps %xmm5,0x30(%esp)
- .byte 15,41,100,36,32 // movaps %xmm4,0x20(%esp)
- .byte 137,124,36,16 // mov %edi,0x10(%esp)
- .byte 137,68,36,12 // mov %eax,0xc(%esp)
- .byte 137,84,36,8 // mov %edx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,12,36 // mov %ecx,(%esp)
- .byte 255,86,4 // call *0x4(%esi)
- .byte 131,196,108 // add $0x6c,%esp
+ .byte 139,85,12 // mov 0xc(%ebp),%edx
+ .byte 139,50 // mov (%edx),%esi
+ .byte 15,16,6 // movups (%esi),%xmm0
+ .byte 15,16,102,64 // movups 0x40(%esi),%xmm4
+ .byte 15,88,128,63,23,0,0 // addps 0x173f(%eax),%xmm0
+ .byte 15,40,168,79,23,0,0 // movaps 0x174f(%eax),%xmm5
+ .byte 15,92,236 // subps %xmm4,%xmm5
+ .byte 15,17,174,128,0,0,0 // movups %xmm5,0x80(%esi)
+ .byte 141,66,8 // lea 0x8(%edx),%eax
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 80 // push %eax
+ .byte 81 // push %ecx
+ .byte 255,82,4 // call *0x4(%edx)
+ .byte 131,196,20 // add $0x14,%esp
.byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
.byte 93 // pop %ebp
.byte 195 // ret
@@ -59631,41 +57390,24 @@ FUNCTION(_sk_bilinear_px_sse2)
_sk_bilinear_px_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
.byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 232,0,0,0,0 // call 8a2c <_sk_bilinear_px_sse2+0xe>
+ .byte 80 // push %eax
+ .byte 232,0,0,0,0 // call 6a34 <_sk_bilinear_px_sse2+0xa>
.byte 88 // pop %eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
- .byte 139,85,16 // mov 0x10(%ebp),%edx
- .byte 139,117,12 // mov 0xc(%ebp),%esi
- .byte 139,62 // mov (%esi),%edi
- .byte 15,16,7 // movups (%edi),%xmm0
- .byte 15,88,128,20,26,0,0 // addps 0x1a14(%eax),%xmm0
- .byte 139,69,20 // mov 0x14(%ebp),%eax
- .byte 15,16,103,64 // movups 0x40(%edi),%xmm4
- .byte 15,17,167,128,0,0,0 // movups %xmm4,0x80(%edi)
- .byte 139,125,24 // mov 0x18(%ebp),%edi
- .byte 15,40,101,40 // movaps 0x28(%ebp),%xmm4
- .byte 15,40,109,56 // movaps 0x38(%ebp),%xmm5
- .byte 15,40,117,72 // movaps 0x48(%ebp),%xmm6
- .byte 15,40,125,88 // movaps 0x58(%ebp),%xmm7
- .byte 141,94,8 // lea 0x8(%esi),%ebx
- .byte 15,41,124,36,80 // movaps %xmm7,0x50(%esp)
- .byte 15,41,116,36,64 // movaps %xmm6,0x40(%esp)
- .byte 15,41,108,36,48 // movaps %xmm5,0x30(%esp)
- .byte 15,41,100,36,32 // movaps %xmm4,0x20(%esp)
- .byte 137,124,36,16 // mov %edi,0x10(%esp)
- .byte 137,68,36,12 // mov %eax,0xc(%esp)
- .byte 137,84,36,8 // mov %edx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,12,36 // mov %ecx,(%esp)
- .byte 255,86,4 // call *0x4(%esi)
- .byte 131,196,108 // add $0x6c,%esp
+ .byte 139,85,12 // mov 0xc(%ebp),%edx
+ .byte 139,50 // mov (%edx),%esi
+ .byte 15,16,6 // movups (%esi),%xmm0
+ .byte 15,16,102,64 // movups 0x40(%esi),%xmm4
+ .byte 15,88,128,28,23,0,0 // addps 0x171c(%eax),%xmm0
+ .byte 15,17,166,128,0,0,0 // movups %xmm4,0x80(%esi)
+ .byte 141,66,8 // lea 0x8(%edx),%eax
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 80 // push %eax
+ .byte 81 // push %ecx
+ .byte 255,82,4 // call *0x4(%edx)
+ .byte 131,196,20 // add $0x14,%esp
.byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
.byte 93 // pop %ebp
.byte 195 // ret
@@ -59675,43 +57417,26 @@ FUNCTION(_sk_bilinear_ny_sse2)
_sk_bilinear_ny_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
.byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 232,0,0,0,0 // call 8aa6 <_sk_bilinear_ny_sse2+0xe>
+ .byte 80 // push %eax
+ .byte 232,0,0,0,0 // call 6a6d <_sk_bilinear_ny_sse2+0xa>
.byte 88 // pop %eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
- .byte 139,85,16 // mov 0x10(%ebp),%edx
- .byte 139,117,12 // mov 0xc(%ebp),%esi
- .byte 139,62 // mov (%esi),%edi
- .byte 15,16,79,32 // movups 0x20(%edi),%xmm1
- .byte 15,88,136,170,25,0,0 // addps 0x19aa(%eax),%xmm1
- .byte 15,40,160,186,25,0,0 // movaps 0x19ba(%eax),%xmm4
- .byte 139,69,20 // mov 0x14(%ebp),%eax
- .byte 15,16,111,96 // movups 0x60(%edi),%xmm5
- .byte 15,92,229 // subps %xmm5,%xmm4
- .byte 15,17,167,160,0,0,0 // movups %xmm4,0xa0(%edi)
- .byte 139,125,24 // mov 0x18(%ebp),%edi
- .byte 15,40,101,40 // movaps 0x28(%ebp),%xmm4
- .byte 15,40,109,56 // movaps 0x38(%ebp),%xmm5
- .byte 15,40,117,72 // movaps 0x48(%ebp),%xmm6
- .byte 15,40,125,88 // movaps 0x58(%ebp),%xmm7
- .byte 141,94,8 // lea 0x8(%esi),%ebx
- .byte 15,41,124,36,80 // movaps %xmm7,0x50(%esp)
- .byte 15,41,116,36,64 // movaps %xmm6,0x40(%esp)
- .byte 15,41,108,36,48 // movaps %xmm5,0x30(%esp)
- .byte 15,41,100,36,32 // movaps %xmm4,0x20(%esp)
- .byte 137,124,36,16 // mov %edi,0x10(%esp)
- .byte 137,68,36,12 // mov %eax,0xc(%esp)
- .byte 137,84,36,8 // mov %edx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,12,36 // mov %ecx,(%esp)
- .byte 255,86,4 // call *0x4(%esi)
- .byte 131,196,108 // add $0x6c,%esp
+ .byte 139,85,12 // mov 0xc(%ebp),%edx
+ .byte 139,50 // mov (%edx),%esi
+ .byte 15,16,78,32 // movups 0x20(%esi),%xmm1
+ .byte 15,16,102,96 // movups 0x60(%esi),%xmm4
+ .byte 15,88,136,243,22,0,0 // addps 0x16f3(%eax),%xmm1
+ .byte 15,40,168,3,23,0,0 // movaps 0x1703(%eax),%xmm5
+ .byte 15,92,236 // subps %xmm4,%xmm5
+ .byte 15,17,174,160,0,0,0 // movups %xmm5,0xa0(%esi)
+ .byte 141,66,8 // lea 0x8(%edx),%eax
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 80 // push %eax
+ .byte 81 // push %ecx
+ .byte 255,82,4 // call *0x4(%edx)
+ .byte 131,196,20 // add $0x14,%esp
.byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
.byte 93 // pop %ebp
.byte 195 // ret
@@ -59721,41 +57446,24 @@ FUNCTION(_sk_bilinear_py_sse2)
_sk_bilinear_py_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
.byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 232,0,0,0,0 // call 8b2b <_sk_bilinear_py_sse2+0xe>
+ .byte 80 // push %eax
+ .byte 232,0,0,0,0 // call 6ab1 <_sk_bilinear_py_sse2+0xa>
.byte 88 // pop %eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
- .byte 139,85,16 // mov 0x10(%ebp),%edx
- .byte 139,117,12 // mov 0xc(%ebp),%esi
- .byte 139,62 // mov (%esi),%edi
- .byte 15,16,79,32 // movups 0x20(%edi),%xmm1
- .byte 15,88,136,69,25,0,0 // addps 0x1945(%eax),%xmm1
- .byte 139,69,20 // mov 0x14(%ebp),%eax
- .byte 15,16,103,96 // movups 0x60(%edi),%xmm4
- .byte 15,17,167,160,0,0,0 // movups %xmm4,0xa0(%edi)
- .byte 139,125,24 // mov 0x18(%ebp),%edi
- .byte 15,40,101,40 // movaps 0x28(%ebp),%xmm4
- .byte 15,40,109,56 // movaps 0x38(%ebp),%xmm5
- .byte 15,40,117,72 // movaps 0x48(%ebp),%xmm6
- .byte 15,40,125,88 // movaps 0x58(%ebp),%xmm7
- .byte 141,94,8 // lea 0x8(%esi),%ebx
- .byte 15,41,124,36,80 // movaps %xmm7,0x50(%esp)
- .byte 15,41,116,36,64 // movaps %xmm6,0x40(%esp)
- .byte 15,41,108,36,48 // movaps %xmm5,0x30(%esp)
- .byte 15,41,100,36,32 // movaps %xmm4,0x20(%esp)
- .byte 137,124,36,16 // mov %edi,0x10(%esp)
- .byte 137,68,36,12 // mov %eax,0xc(%esp)
- .byte 137,84,36,8 // mov %edx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,12,36 // mov %ecx,(%esp)
- .byte 255,86,4 // call *0x4(%esi)
- .byte 131,196,108 // add $0x6c,%esp
+ .byte 139,85,12 // mov 0xc(%ebp),%edx
+ .byte 139,50 // mov (%edx),%esi
+ .byte 15,16,78,32 // movups 0x20(%esi),%xmm1
+ .byte 15,16,102,96 // movups 0x60(%esi),%xmm4
+ .byte 15,88,136,207,22,0,0 // addps 0x16cf(%eax),%xmm1
+ .byte 15,17,166,160,0,0,0 // movups %xmm4,0xa0(%esi)
+ .byte 141,66,8 // lea 0x8(%edx),%eax
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 80 // push %eax
+ .byte 81 // push %ecx
+ .byte 255,82,4 // call *0x4(%edx)
+ .byte 131,196,20 // add $0x14,%esp
.byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
.byte 93 // pop %ebp
.byte 195 // ret
@@ -59765,48 +57473,31 @@ FUNCTION(_sk_bicubic_n3x_sse2)
_sk_bicubic_n3x_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
.byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 232,0,0,0,0 // call 8ba6 <_sk_bicubic_n3x_sse2+0xe>
- .byte 94 // pop %esi
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
+ .byte 80 // push %eax
+ .byte 232,0,0,0,0 // call 6aeb <_sk_bicubic_n3x_sse2+0xa>
+ .byte 88 // pop %eax
+ .byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 139,85,12 // mov 0xc(%ebp),%edx
- .byte 139,58 // mov (%edx),%edi
- .byte 15,16,7 // movups (%edi),%xmm0
- .byte 15,16,103,64 // movups 0x40(%edi),%xmm4
- .byte 15,88,134,218,24,0,0 // addps 0x18da(%esi),%xmm0
- .byte 15,40,174,234,24,0,0 // movaps 0x18ea(%esi),%xmm5
+ .byte 139,50 // mov (%edx),%esi
+ .byte 15,16,6 // movups (%esi),%xmm0
+ .byte 15,16,102,64 // movups 0x40(%esi),%xmm4
+ .byte 15,88,128,165,22,0,0 // addps 0x16a5(%eax),%xmm0
+ .byte 15,40,168,181,22,0,0 // movaps 0x16b5(%eax),%xmm5
.byte 15,92,236 // subps %xmm4,%xmm5
.byte 15,40,229 // movaps %xmm5,%xmm4
- .byte 15,89,174,250,24,0,0 // mulps 0x18fa(%esi),%xmm5
- .byte 15,88,174,10,25,0,0 // addps 0x190a(%esi),%xmm5
- .byte 139,117,20 // mov 0x14(%ebp),%esi
.byte 15,89,228 // mulps %xmm4,%xmm4
+ .byte 15,89,168,197,22,0,0 // mulps 0x16c5(%eax),%xmm5
+ .byte 15,88,168,213,22,0,0 // addps 0x16d5(%eax),%xmm5
.byte 15,89,236 // mulps %xmm4,%xmm5
- .byte 15,17,175,128,0,0,0 // movups %xmm5,0x80(%edi)
- .byte 139,125,24 // mov 0x18(%ebp),%edi
- .byte 15,40,101,40 // movaps 0x28(%ebp),%xmm4
- .byte 15,40,109,56 // movaps 0x38(%ebp),%xmm5
- .byte 15,40,117,72 // movaps 0x48(%ebp),%xmm6
- .byte 15,40,125,88 // movaps 0x58(%ebp),%xmm7
- .byte 141,90,8 // lea 0x8(%edx),%ebx
- .byte 15,41,124,36,80 // movaps %xmm7,0x50(%esp)
- .byte 15,41,116,36,64 // movaps %xmm6,0x40(%esp)
- .byte 15,41,108,36,48 // movaps %xmm5,0x30(%esp)
- .byte 15,41,100,36,32 // movaps %xmm4,0x20(%esp)
- .byte 137,124,36,16 // mov %edi,0x10(%esp)
- .byte 137,116,36,12 // mov %esi,0xc(%esp)
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
+ .byte 15,17,174,128,0,0,0 // movups %xmm5,0x80(%esi)
+ .byte 141,66,8 // lea 0x8(%edx),%eax
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 80 // push %eax
+ .byte 81 // push %ecx
.byte 255,82,4 // call *0x4(%edx)
- .byte 131,196,108 // add $0x6c,%esp
+ .byte 131,196,20 // add $0x14,%esp
.byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
.byte 93 // pop %ebp
.byte 195 // ret
@@ -59816,50 +57507,33 @@ FUNCTION(_sk_bicubic_n1x_sse2)
_sk_bicubic_n1x_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
.byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 232,0,0,0,0 // call 8c41 <_sk_bicubic_n1x_sse2+0xe>
- .byte 94 // pop %esi
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
+ .byte 80 // push %eax
+ .byte 232,0,0,0,0 // call 6b45 <_sk_bicubic_n1x_sse2+0xa>
+ .byte 88 // pop %eax
+ .byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 139,85,12 // mov 0xc(%ebp),%edx
- .byte 139,58 // mov (%edx),%edi
- .byte 15,16,7 // movups (%edi),%xmm0
- .byte 15,16,103,64 // movups 0x40(%edi),%xmm4
- .byte 15,88,134,127,24,0,0 // addps 0x187f(%esi),%xmm0
- .byte 15,40,174,143,24,0,0 // movaps 0x188f(%esi),%xmm5
+ .byte 139,50 // mov (%edx),%esi
+ .byte 15,16,6 // movups (%esi),%xmm0
+ .byte 15,16,102,64 // movups 0x40(%esi),%xmm4
+ .byte 15,88,128,139,22,0,0 // addps 0x168b(%eax),%xmm0
+ .byte 15,40,168,155,22,0,0 // movaps 0x169b(%eax),%xmm5
.byte 15,92,236 // subps %xmm4,%xmm5
- .byte 15,40,166,159,24,0,0 // movaps 0x189f(%esi),%xmm4
+ .byte 15,40,160,171,22,0,0 // movaps 0x16ab(%eax),%xmm4
.byte 15,89,229 // mulps %xmm5,%xmm4
- .byte 15,88,166,175,24,0,0 // addps 0x18af(%esi),%xmm4
+ .byte 15,88,160,187,22,0,0 // addps 0x16bb(%eax),%xmm4
.byte 15,89,229 // mulps %xmm5,%xmm4
- .byte 15,88,166,191,24,0,0 // addps 0x18bf(%esi),%xmm4
+ .byte 15,88,160,203,22,0,0 // addps 0x16cb(%eax),%xmm4
.byte 15,89,229 // mulps %xmm5,%xmm4
- .byte 15,88,166,207,24,0,0 // addps 0x18cf(%esi),%xmm4
- .byte 139,117,20 // mov 0x14(%ebp),%esi
- .byte 15,17,167,128,0,0,0 // movups %xmm4,0x80(%edi)
- .byte 139,125,24 // mov 0x18(%ebp),%edi
- .byte 15,40,101,40 // movaps 0x28(%ebp),%xmm4
- .byte 15,40,109,56 // movaps 0x38(%ebp),%xmm5
- .byte 15,40,117,72 // movaps 0x48(%ebp),%xmm6
- .byte 15,40,125,88 // movaps 0x58(%ebp),%xmm7
- .byte 141,90,8 // lea 0x8(%edx),%ebx
- .byte 15,41,124,36,80 // movaps %xmm7,0x50(%esp)
- .byte 15,41,116,36,64 // movaps %xmm6,0x40(%esp)
- .byte 15,41,108,36,48 // movaps %xmm5,0x30(%esp)
- .byte 15,41,100,36,32 // movaps %xmm4,0x20(%esp)
- .byte 137,124,36,16 // mov %edi,0x10(%esp)
- .byte 137,116,36,12 // mov %esi,0xc(%esp)
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
+ .byte 15,88,160,219,22,0,0 // addps 0x16db(%eax),%xmm4
+ .byte 15,17,166,128,0,0,0 // movups %xmm4,0x80(%esi)
+ .byte 141,66,8 // lea 0x8(%edx),%eax
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 80 // push %eax
+ .byte 81 // push %ecx
.byte 255,82,4 // call *0x4(%edx)
- .byte 131,196,108 // add $0x6c,%esp
+ .byte 131,196,20 // add $0x14,%esp
.byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
.byte 93 // pop %ebp
.byte 195 // ret
@@ -59869,49 +57543,32 @@ FUNCTION(_sk_bicubic_p1x_sse2)
_sk_bicubic_p1x_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
.byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 232,0,0,0,0 // call 8cea <_sk_bicubic_p1x_sse2+0xe>
- .byte 94 // pop %esi
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
+ .byte 80 // push %eax
+ .byte 232,0,0,0,0 // call 6bad <_sk_bicubic_p1x_sse2+0xa>
+ .byte 88 // pop %eax
+ .byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 139,85,12 // mov 0xc(%ebp),%edx
- .byte 139,58 // mov (%edx),%edi
- .byte 15,40,166,54,24,0,0 // movaps 0x1836(%esi),%xmm4
- .byte 15,16,71,64 // movups 0x40(%edi),%xmm0
- .byte 15,40,174,70,24,0,0 // movaps 0x1846(%esi),%xmm5
- .byte 15,89,232 // mulps %xmm0,%xmm5
- .byte 15,88,174,86,24,0,0 // addps 0x1856(%esi),%xmm5
- .byte 15,89,232 // mulps %xmm0,%xmm5
- .byte 15,88,236 // addps %xmm4,%xmm5
- .byte 15,89,232 // mulps %xmm0,%xmm5
- .byte 15,88,174,102,24,0,0 // addps 0x1866(%esi),%xmm5
- .byte 139,117,20 // mov 0x14(%ebp),%esi
- .byte 15,16,7 // movups (%edi),%xmm0
- .byte 15,17,175,128,0,0,0 // movups %xmm5,0x80(%edi)
- .byte 139,125,24 // mov 0x18(%ebp),%edi
- .byte 15,40,109,40 // movaps 0x28(%ebp),%xmm5
- .byte 15,40,117,56 // movaps 0x38(%ebp),%xmm6
- .byte 15,40,125,72 // movaps 0x48(%ebp),%xmm7
+ .byte 139,50 // mov (%edx),%esi
+ .byte 15,40,160,131,22,0,0 // movaps 0x1683(%eax),%xmm4
+ .byte 15,16,6 // movups (%esi),%xmm0
+ .byte 15,16,110,64 // movups 0x40(%esi),%xmm5
.byte 15,88,196 // addps %xmm4,%xmm0
- .byte 15,40,101,88 // movaps 0x58(%ebp),%xmm4
- .byte 141,90,8 // lea 0x8(%edx),%ebx
- .byte 15,41,100,36,80 // movaps %xmm4,0x50(%esp)
- .byte 15,41,124,36,64 // movaps %xmm7,0x40(%esp)
- .byte 15,41,116,36,48 // movaps %xmm6,0x30(%esp)
- .byte 15,41,108,36,32 // movaps %xmm5,0x20(%esp)
- .byte 137,124,36,16 // mov %edi,0x10(%esp)
- .byte 137,116,36,12 // mov %esi,0xc(%esp)
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
+ .byte 15,40,176,147,22,0,0 // movaps 0x1693(%eax),%xmm6
+ .byte 15,89,245 // mulps %xmm5,%xmm6
+ .byte 15,88,176,163,22,0,0 // addps 0x16a3(%eax),%xmm6
+ .byte 15,89,245 // mulps %xmm5,%xmm6
+ .byte 15,88,244 // addps %xmm4,%xmm6
+ .byte 15,89,245 // mulps %xmm5,%xmm6
+ .byte 15,88,176,179,22,0,0 // addps 0x16b3(%eax),%xmm6
+ .byte 15,17,182,128,0,0,0 // movups %xmm6,0x80(%esi)
+ .byte 141,66,8 // lea 0x8(%edx),%eax
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 80 // push %eax
+ .byte 81 // push %ecx
.byte 255,82,4 // call *0x4(%edx)
- .byte 131,196,108 // add $0x6c,%esp
+ .byte 131,196,20 // add $0x14,%esp
.byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
.byte 93 // pop %ebp
.byte 195 // ret
@@ -59921,46 +57578,29 @@ FUNCTION(_sk_bicubic_p3x_sse2)
_sk_bicubic_p3x_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
.byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 232,0,0,0,0 // call 8d88 <_sk_bicubic_p3x_sse2+0xe>
- .byte 89 // pop %ecx
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,85,16 // mov 0x10(%ebp),%edx
- .byte 139,117,12 // mov 0xc(%ebp),%esi
- .byte 139,62 // mov (%esi),%edi
- .byte 15,16,7 // movups (%edi),%xmm0
- .byte 15,16,103,64 // movups 0x40(%edi),%xmm4
- .byte 15,88,129,216,23,0,0 // addps 0x17d8(%ecx),%xmm0
+ .byte 80 // push %eax
+ .byte 232,0,0,0,0 // call 6c0a <_sk_bicubic_p3x_sse2+0xa>
+ .byte 88 // pop %eax
+ .byte 139,77,8 // mov 0x8(%ebp),%ecx
+ .byte 139,85,12 // mov 0xc(%ebp),%edx
+ .byte 139,50 // mov (%edx),%esi
+ .byte 15,16,6 // movups (%esi),%xmm0
+ .byte 15,16,102,64 // movups 0x40(%esi),%xmm4
+ .byte 15,88,128,102,22,0,0 // addps 0x1666(%eax),%xmm0
.byte 15,40,236 // movaps %xmm4,%xmm5
- .byte 15,89,161,232,23,0,0 // mulps 0x17e8(%ecx),%xmm4
- .byte 15,88,161,248,23,0,0 // addps 0x17f8(%ecx),%xmm4
- .byte 139,77,20 // mov 0x14(%ebp),%ecx
.byte 15,89,237 // mulps %xmm5,%xmm5
+ .byte 15,89,160,118,22,0,0 // mulps 0x1676(%eax),%xmm4
+ .byte 15,88,160,134,22,0,0 // addps 0x1686(%eax),%xmm4
.byte 15,89,229 // mulps %xmm5,%xmm4
- .byte 15,17,167,128,0,0,0 // movups %xmm4,0x80(%edi)
- .byte 139,125,24 // mov 0x18(%ebp),%edi
- .byte 15,40,101,40 // movaps 0x28(%ebp),%xmm4
- .byte 15,40,109,56 // movaps 0x38(%ebp),%xmm5
- .byte 15,40,117,72 // movaps 0x48(%ebp),%xmm6
- .byte 15,40,125,88 // movaps 0x58(%ebp),%xmm7
- .byte 141,94,8 // lea 0x8(%esi),%ebx
- .byte 15,41,124,36,80 // movaps %xmm7,0x50(%esp)
- .byte 15,41,116,36,64 // movaps %xmm6,0x40(%esp)
- .byte 15,41,108,36,48 // movaps %xmm5,0x30(%esp)
- .byte 15,41,100,36,32 // movaps %xmm4,0x20(%esp)
- .byte 137,124,36,16 // mov %edi,0x10(%esp)
- .byte 137,76,36,12 // mov %ecx,0xc(%esp)
- .byte 137,84,36,8 // mov %edx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
- .byte 255,86,4 // call *0x4(%esi)
- .byte 131,196,108 // add $0x6c,%esp
+ .byte 15,17,166,128,0,0,0 // movups %xmm4,0x80(%esi)
+ .byte 141,66,8 // lea 0x8(%edx),%eax
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 80 // push %eax
+ .byte 81 // push %ecx
+ .byte 255,82,4 // call *0x4(%edx)
+ .byte 131,196,20 // add $0x14,%esp
.byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
.byte 93 // pop %ebp
.byte 195 // ret
@@ -59970,48 +57610,31 @@ FUNCTION(_sk_bicubic_n3y_sse2)
_sk_bicubic_n3y_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
.byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 232,0,0,0,0 // call 8e19 <_sk_bicubic_n3y_sse2+0xe>
- .byte 94 // pop %esi
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
+ .byte 80 // push %eax
+ .byte 232,0,0,0,0 // call 6c5a <_sk_bicubic_n3y_sse2+0xa>
+ .byte 88 // pop %eax
+ .byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 139,85,12 // mov 0xc(%ebp),%edx
- .byte 139,58 // mov (%edx),%edi
- .byte 15,16,79,32 // movups 0x20(%edi),%xmm1
- .byte 15,16,103,96 // movups 0x60(%edi),%xmm4
- .byte 15,88,142,119,23,0,0 // addps 0x1777(%esi),%xmm1
- .byte 15,40,174,135,23,0,0 // movaps 0x1787(%esi),%xmm5
+ .byte 139,50 // mov (%edx),%esi
+ .byte 15,16,78,32 // movups 0x20(%esi),%xmm1
+ .byte 15,16,102,96 // movups 0x60(%esi),%xmm4
+ .byte 15,88,136,70,22,0,0 // addps 0x1646(%eax),%xmm1
+ .byte 15,40,168,86,22,0,0 // movaps 0x1656(%eax),%xmm5
.byte 15,92,236 // subps %xmm4,%xmm5
.byte 15,40,229 // movaps %xmm5,%xmm4
- .byte 15,89,174,151,23,0,0 // mulps 0x1797(%esi),%xmm5
- .byte 15,88,174,167,23,0,0 // addps 0x17a7(%esi),%xmm5
- .byte 139,117,20 // mov 0x14(%ebp),%esi
.byte 15,89,228 // mulps %xmm4,%xmm4
+ .byte 15,89,168,102,22,0,0 // mulps 0x1666(%eax),%xmm5
+ .byte 15,88,168,118,22,0,0 // addps 0x1676(%eax),%xmm5
.byte 15,89,236 // mulps %xmm4,%xmm5
- .byte 15,17,175,160,0,0,0 // movups %xmm5,0xa0(%edi)
- .byte 139,125,24 // mov 0x18(%ebp),%edi
- .byte 15,40,101,40 // movaps 0x28(%ebp),%xmm4
- .byte 15,40,109,56 // movaps 0x38(%ebp),%xmm5
- .byte 15,40,117,72 // movaps 0x48(%ebp),%xmm6
- .byte 15,40,125,88 // movaps 0x58(%ebp),%xmm7
- .byte 141,90,8 // lea 0x8(%edx),%ebx
- .byte 15,41,124,36,80 // movaps %xmm7,0x50(%esp)
- .byte 15,41,116,36,64 // movaps %xmm6,0x40(%esp)
- .byte 15,41,108,36,48 // movaps %xmm5,0x30(%esp)
- .byte 15,41,100,36,32 // movaps %xmm4,0x20(%esp)
- .byte 137,124,36,16 // mov %edi,0x10(%esp)
- .byte 137,116,36,12 // mov %esi,0xc(%esp)
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
+ .byte 15,17,174,160,0,0,0 // movups %xmm5,0xa0(%esi)
+ .byte 141,66,8 // lea 0x8(%edx),%eax
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 80 // push %eax
+ .byte 81 // push %ecx
.byte 255,82,4 // call *0x4(%edx)
- .byte 131,196,108 // add $0x6c,%esp
+ .byte 131,196,20 // add $0x14,%esp
.byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
.byte 93 // pop %ebp
.byte 195 // ret
@@ -60021,50 +57644,33 @@ FUNCTION(_sk_bicubic_n1y_sse2)
_sk_bicubic_n1y_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
.byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 232,0,0,0,0 // call 8eb5 <_sk_bicubic_n1y_sse2+0xe>
- .byte 94 // pop %esi
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
+ .byte 80 // push %eax
+ .byte 232,0,0,0,0 // call 6cb5 <_sk_bicubic_n1y_sse2+0xa>
+ .byte 88 // pop %eax
+ .byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 139,85,12 // mov 0xc(%ebp),%edx
- .byte 139,58 // mov (%edx),%edi
- .byte 15,16,79,32 // movups 0x20(%edi),%xmm1
- .byte 15,16,103,96 // movups 0x60(%edi),%xmm4
- .byte 15,88,142,27,23,0,0 // addps 0x171b(%esi),%xmm1
- .byte 15,40,174,43,23,0,0 // movaps 0x172b(%esi),%xmm5
+ .byte 139,50 // mov (%edx),%esi
+ .byte 15,16,78,32 // movups 0x20(%esi),%xmm1
+ .byte 15,16,102,96 // movups 0x60(%esi),%xmm4
+ .byte 15,88,136,43,22,0,0 // addps 0x162b(%eax),%xmm1
+ .byte 15,40,168,59,22,0,0 // movaps 0x163b(%eax),%xmm5
.byte 15,92,236 // subps %xmm4,%xmm5
- .byte 15,40,166,59,23,0,0 // movaps 0x173b(%esi),%xmm4
+ .byte 15,40,160,75,22,0,0 // movaps 0x164b(%eax),%xmm4
.byte 15,89,229 // mulps %xmm5,%xmm4
- .byte 15,88,166,75,23,0,0 // addps 0x174b(%esi),%xmm4
+ .byte 15,88,160,91,22,0,0 // addps 0x165b(%eax),%xmm4
.byte 15,89,229 // mulps %xmm5,%xmm4
- .byte 15,88,166,91,23,0,0 // addps 0x175b(%esi),%xmm4
+ .byte 15,88,160,107,22,0,0 // addps 0x166b(%eax),%xmm4
.byte 15,89,229 // mulps %xmm5,%xmm4
- .byte 15,88,166,107,23,0,0 // addps 0x176b(%esi),%xmm4
- .byte 139,117,20 // mov 0x14(%ebp),%esi
- .byte 15,17,167,160,0,0,0 // movups %xmm4,0xa0(%edi)
- .byte 139,125,24 // mov 0x18(%ebp),%edi
- .byte 15,40,101,40 // movaps 0x28(%ebp),%xmm4
- .byte 15,40,109,56 // movaps 0x38(%ebp),%xmm5
- .byte 15,40,117,72 // movaps 0x48(%ebp),%xmm6
- .byte 15,40,125,88 // movaps 0x58(%ebp),%xmm7
- .byte 141,90,8 // lea 0x8(%edx),%ebx
- .byte 15,41,124,36,80 // movaps %xmm7,0x50(%esp)
- .byte 15,41,116,36,64 // movaps %xmm6,0x40(%esp)
- .byte 15,41,108,36,48 // movaps %xmm5,0x30(%esp)
- .byte 15,41,100,36,32 // movaps %xmm4,0x20(%esp)
- .byte 137,124,36,16 // mov %edi,0x10(%esp)
- .byte 137,116,36,12 // mov %esi,0xc(%esp)
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
+ .byte 15,88,160,123,22,0,0 // addps 0x167b(%eax),%xmm4
+ .byte 15,17,166,160,0,0,0 // movups %xmm4,0xa0(%esi)
+ .byte 141,66,8 // lea 0x8(%edx),%eax
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 80 // push %eax
+ .byte 81 // push %ecx
.byte 255,82,4 // call *0x4(%edx)
- .byte 131,196,108 // add $0x6c,%esp
+ .byte 131,196,20 // add $0x14,%esp
.byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
.byte 93 // pop %ebp
.byte 195 // ret
@@ -60074,49 +57680,32 @@ FUNCTION(_sk_bicubic_p1y_sse2)
_sk_bicubic_p1y_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
.byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 232,0,0,0,0 // call 8f5f <_sk_bicubic_p1y_sse2+0xe>
- .byte 94 // pop %esi
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
+ .byte 80 // push %eax
+ .byte 232,0,0,0,0 // call 6d1e <_sk_bicubic_p1y_sse2+0xa>
+ .byte 88 // pop %eax
+ .byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 139,85,12 // mov 0xc(%ebp),%edx
- .byte 139,58 // mov (%edx),%edi
- .byte 15,40,166,209,22,0,0 // movaps 0x16d1(%esi),%xmm4
- .byte 15,16,79,96 // movups 0x60(%edi),%xmm1
- .byte 15,40,174,225,22,0,0 // movaps 0x16e1(%esi),%xmm5
- .byte 15,89,233 // mulps %xmm1,%xmm5
- .byte 15,88,174,241,22,0,0 // addps 0x16f1(%esi),%xmm5
- .byte 15,89,233 // mulps %xmm1,%xmm5
- .byte 15,88,236 // addps %xmm4,%xmm5
- .byte 15,89,233 // mulps %xmm1,%xmm5
- .byte 15,88,174,1,23,0,0 // addps 0x1701(%esi),%xmm5
- .byte 139,117,20 // mov 0x14(%ebp),%esi
- .byte 15,16,79,32 // movups 0x20(%edi),%xmm1
- .byte 15,17,175,160,0,0,0 // movups %xmm5,0xa0(%edi)
- .byte 139,125,24 // mov 0x18(%ebp),%edi
- .byte 15,40,109,40 // movaps 0x28(%ebp),%xmm5
- .byte 15,40,117,56 // movaps 0x38(%ebp),%xmm6
- .byte 15,40,125,72 // movaps 0x48(%ebp),%xmm7
+ .byte 139,50 // mov (%edx),%esi
+ .byte 15,40,160,34,22,0,0 // movaps 0x1622(%eax),%xmm4
+ .byte 15,16,78,32 // movups 0x20(%esi),%xmm1
+ .byte 15,16,110,96 // movups 0x60(%esi),%xmm5
.byte 15,88,204 // addps %xmm4,%xmm1
- .byte 15,40,101,88 // movaps 0x58(%ebp),%xmm4
- .byte 141,90,8 // lea 0x8(%edx),%ebx
- .byte 15,41,100,36,80 // movaps %xmm4,0x50(%esp)
- .byte 15,41,124,36,64 // movaps %xmm7,0x40(%esp)
- .byte 15,41,116,36,48 // movaps %xmm6,0x30(%esp)
- .byte 15,41,108,36,32 // movaps %xmm5,0x20(%esp)
- .byte 137,124,36,16 // mov %edi,0x10(%esp)
- .byte 137,116,36,12 // mov %esi,0xc(%esp)
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
+ .byte 15,40,176,50,22,0,0 // movaps 0x1632(%eax),%xmm6
+ .byte 15,89,245 // mulps %xmm5,%xmm6
+ .byte 15,88,176,66,22,0,0 // addps 0x1642(%eax),%xmm6
+ .byte 15,89,245 // mulps %xmm5,%xmm6
+ .byte 15,88,244 // addps %xmm4,%xmm6
+ .byte 15,89,245 // mulps %xmm5,%xmm6
+ .byte 15,88,176,82,22,0,0 // addps 0x1652(%eax),%xmm6
+ .byte 15,17,182,160,0,0,0 // movups %xmm6,0xa0(%esi)
+ .byte 141,66,8 // lea 0x8(%edx),%eax
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 80 // push %eax
+ .byte 81 // push %ecx
.byte 255,82,4 // call *0x4(%edx)
- .byte 131,196,108 // add $0x6c,%esp
+ .byte 131,196,20 // add $0x14,%esp
.byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
.byte 93 // pop %ebp
.byte 195 // ret
@@ -60126,46 +57715,29 @@ FUNCTION(_sk_bicubic_p3y_sse2)
_sk_bicubic_p3y_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
- .byte 83 // push %ebx
- .byte 87 // push %edi
.byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
- .byte 232,0,0,0,0 // call 8ffe <_sk_bicubic_p3y_sse2+0xe>
- .byte 89 // pop %ecx
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 139,85,16 // mov 0x10(%ebp),%edx
- .byte 139,117,12 // mov 0xc(%ebp),%esi
- .byte 139,62 // mov (%esi),%edi
- .byte 15,16,79,32 // movups 0x20(%edi),%xmm1
- .byte 15,16,103,96 // movups 0x60(%edi),%xmm4
- .byte 15,88,137,114,22,0,0 // addps 0x1672(%ecx),%xmm1
+ .byte 80 // push %eax
+ .byte 232,0,0,0,0 // call 6d7c <_sk_bicubic_p3y_sse2+0xa>
+ .byte 88 // pop %eax
+ .byte 139,77,8 // mov 0x8(%ebp),%ecx
+ .byte 139,85,12 // mov 0xc(%ebp),%edx
+ .byte 139,50 // mov (%edx),%esi
+ .byte 15,16,78,32 // movups 0x20(%esi),%xmm1
+ .byte 15,16,102,96 // movups 0x60(%esi),%xmm4
+ .byte 15,88,136,4,22,0,0 // addps 0x1604(%eax),%xmm1
.byte 15,40,236 // movaps %xmm4,%xmm5
- .byte 15,89,161,130,22,0,0 // mulps 0x1682(%ecx),%xmm4
- .byte 15,88,161,146,22,0,0 // addps 0x1692(%ecx),%xmm4
- .byte 139,77,20 // mov 0x14(%ebp),%ecx
.byte 15,89,237 // mulps %xmm5,%xmm5
+ .byte 15,89,160,20,22,0,0 // mulps 0x1614(%eax),%xmm4
+ .byte 15,88,160,36,22,0,0 // addps 0x1624(%eax),%xmm4
.byte 15,89,229 // mulps %xmm5,%xmm4
- .byte 15,17,167,160,0,0,0 // movups %xmm4,0xa0(%edi)
- .byte 139,125,24 // mov 0x18(%ebp),%edi
- .byte 15,40,101,40 // movaps 0x28(%ebp),%xmm4
- .byte 15,40,109,56 // movaps 0x38(%ebp),%xmm5
- .byte 15,40,117,72 // movaps 0x48(%ebp),%xmm6
- .byte 15,40,125,88 // movaps 0x58(%ebp),%xmm7
- .byte 141,94,8 // lea 0x8(%esi),%ebx
- .byte 15,41,124,36,80 // movaps %xmm7,0x50(%esp)
- .byte 15,41,116,36,64 // movaps %xmm6,0x40(%esp)
- .byte 15,41,108,36,48 // movaps %xmm5,0x30(%esp)
- .byte 15,41,100,36,32 // movaps %xmm4,0x20(%esp)
- .byte 137,124,36,16 // mov %edi,0x10(%esp)
- .byte 137,76,36,12 // mov %ecx,0xc(%esp)
- .byte 137,84,36,8 // mov %edx,0x8(%esp)
- .byte 137,92,36,4 // mov %ebx,0x4(%esp)
- .byte 137,4,36 // mov %eax,(%esp)
- .byte 255,86,4 // call *0x4(%esi)
- .byte 131,196,108 // add $0x6c,%esp
+ .byte 15,17,166,160,0,0,0 // movups %xmm4,0xa0(%esi)
+ .byte 141,66,8 // lea 0x8(%edx),%eax
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 80 // push %eax
+ .byte 81 // push %ecx
+ .byte 255,82,4 // call *0x4(%edx)
+ .byte 131,196,20 // add $0x14,%esp
.byte 94 // pop %esi
- .byte 95 // pop %edi
- .byte 91 // pop %ebx
.byte 93 // pop %ebp
.byte 195 // ret
@@ -60178,33 +57750,36 @@ _sk_callback_sse2:
.byte 83 // push %ebx
.byte 87 // push %edi
.byte 86 // push %esi
- .byte 131,236,108 // sub $0x6c,%esp
+ .byte 131,236,12 // sub $0xc,%esp
+ .byte 139,117,12 // mov 0xc(%ebp),%esi
+ .byte 139,125,8 // mov 0x8(%ebp),%edi
+ .byte 139,71,8 // mov 0x8(%edi),%eax
+ .byte 139,30 // mov (%esi),%ebx
.byte 15,40,224 // movaps %xmm0,%xmm4
.byte 15,20,225 // unpcklps %xmm1,%xmm4
+ .byte 15,40,234 // movaps %xmm2,%xmm5
+ .byte 15,20,235 // unpcklps %xmm3,%xmm5
.byte 15,21,193 // unpckhps %xmm1,%xmm0
- .byte 15,40,202 // movaps %xmm2,%xmm1
- .byte 15,20,203 // unpcklps %xmm3,%xmm1
.byte 15,21,211 // unpckhps %xmm3,%xmm2
- .byte 15,40,220 // movaps %xmm4,%xmm3
- .byte 102,15,20,217 // unpcklpd %xmm1,%xmm3
- .byte 15,18,204 // movhlps %xmm4,%xmm1
- .byte 139,117,12 // mov 0xc(%ebp),%esi
- .byte 139,62 // mov (%esi),%edi
- .byte 102,15,17,95,4 // movupd %xmm3,0x4(%edi)
+ .byte 15,40,204 // movaps %xmm4,%xmm1
+ .byte 102,15,20,205 // unpcklpd %xmm5,%xmm1
+ .byte 15,18,236 // movhlps %xmm4,%xmm5
.byte 15,40,216 // movaps %xmm0,%xmm3
.byte 102,15,20,218 // unpcklpd %xmm2,%xmm3
+ .byte 102,15,17,75,4 // movupd %xmm1,0x4(%ebx)
.byte 15,18,208 // movhlps %xmm0,%xmm2
- .byte 15,17,79,20 // movups %xmm1,0x14(%edi)
- .byte 102,15,17,95,36 // movupd %xmm3,0x24(%edi)
- .byte 15,17,87,52 // movups %xmm2,0x34(%edi)
- .byte 139,93,24 // mov 0x18(%ebp),%ebx
- .byte 133,219 // test %ebx,%ebx
- .byte 184,4,0,0,0 // mov $0x4,%eax
- .byte 15,69,195 // cmovne %ebx,%eax
- .byte 137,68,36,4 // mov %eax,0x4(%esp)
- .byte 137,60,36 // mov %edi,(%esp)
- .byte 255,23 // call *(%edi)
- .byte 139,135,132,0,0,0 // mov 0x84(%edi),%eax
+ .byte 15,17,107,20 // movups %xmm5,0x14(%ebx)
+ .byte 102,15,17,91,36 // movupd %xmm3,0x24(%ebx)
+ .byte 15,17,83,52 // movups %xmm2,0x34(%ebx)
+ .byte 133,192 // test %eax,%eax
+ .byte 185,4,0,0,0 // mov $0x4,%ecx
+ .byte 15,69,200 // cmovne %eax,%ecx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 81 // push %ecx
+ .byte 83 // push %ebx
+ .byte 255,19 // call *(%ebx)
+ .byte 131,196,16 // add $0x10,%esp
+ .byte 139,131,132,0,0,0 // mov 0x84(%ebx),%eax
.byte 15,16,32 // movups (%eax),%xmm4
.byte 15,16,64,16 // movups 0x10(%eax),%xmm0
.byte 15,16,88,32 // movups 0x20(%eax),%xmm3
@@ -60222,24 +57797,11 @@ _sk_callback_sse2:
.byte 102,15,20,211 // unpcklpd %xmm3,%xmm2
.byte 15,18,220 // movhlps %xmm4,%xmm3
.byte 141,70,8 // lea 0x8(%esi),%eax
- .byte 15,40,101,88 // movaps 0x58(%ebp),%xmm4
- .byte 15,41,100,36,80 // movaps %xmm4,0x50(%esp)
- .byte 15,40,101,72 // movaps 0x48(%ebp),%xmm4
- .byte 15,41,100,36,64 // movaps %xmm4,0x40(%esp)
- .byte 15,40,101,56 // movaps 0x38(%ebp),%xmm4
- .byte 15,41,100,36,48 // movaps %xmm4,0x30(%esp)
- .byte 15,40,101,40 // movaps 0x28(%ebp),%xmm4
- .byte 15,41,100,36,32 // movaps %xmm4,0x20(%esp)
- .byte 137,92,36,16 // mov %ebx,0x10(%esp)
- .byte 139,77,20 // mov 0x14(%ebp),%ecx
- .byte 137,76,36,12 // mov %ecx,0xc(%esp)
- .byte 139,77,16 // mov 0x10(%ebp),%ecx
- .byte 137,76,36,8 // mov %ecx,0x8(%esp)
- .byte 137,68,36,4 // mov %eax,0x4(%esp)
- .byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 137,4,36 // mov %eax,(%esp)
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 80 // push %eax
+ .byte 87 // push %edi
.byte 255,86,4 // call *0x4(%esi)
- .byte 131,196,108 // add $0x6c,%esp
+ .byte 131,196,28 // add $0x1c,%esp
.byte 94 // pop %esi
.byte 95 // pop %edi
.byte 91 // pop %ebx
@@ -60403,9 +57965,9 @@ BALIGN16
.byte 0,224 // add %ah,%al
.byte 64 // inc %eax
.byte 0,0 // add %al,(%eax)
- .byte 224,64 // loopne 936c <.literal16+0x1fc>
+ .byte 224,64 // loopne 707c <.literal16+0x1fc>
.byte 0,0 // add %al,(%eax)
- .byte 224,64 // loopne 9370 <.literal16+0x200>
+ .byte 224,64 // loopne 7080 <.literal16+0x200>
.byte 154,153,153,62,154,153,153 // lcall $0x9999,$0x9a3e9999
.byte 62,154,153,153,62,154,153,153 // ds lcall $0x9999,$0x9a3e9999
.byte 62,61,10,23,63,61 // ds cmp $0x3d3f170a,%eax
@@ -60416,16 +57978,16 @@ BALIGN16
.byte 63 // aas
.byte 174 // scas %es:(%edi),%al
.byte 71 // inc %edi
- .byte 225,61 // loope 9391 <.literal16+0x221>
+ .byte 225,61 // loope 70a1 <.literal16+0x221>
.byte 174 // scas %es:(%edi),%al
.byte 71 // inc %edi
- .byte 225,61 // loope 9395 <.literal16+0x225>
+ .byte 225,61 // loope 70a5 <.literal16+0x225>
.byte 174 // scas %es:(%edi),%al
.byte 71 // inc %edi
- .byte 225,61 // loope 9399 <.literal16+0x229>
+ .byte 225,61 // loope 70a9 <.literal16+0x229>
.byte 174 // scas %es:(%edi),%al
.byte 71 // inc %edi
- .byte 225,61 // loope 939d <.literal16+0x22d>
+ .byte 225,61 // loope 70ad <.literal16+0x22d>
.byte 0,0 // add %al,(%eax)
.byte 128,63,0 // cmpb $0x0,(%edi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax)
@@ -60442,16 +58004,16 @@ BALIGN16
.byte 63 // aas
.byte 61,10,23,63,174 // cmp $0xae3f170a,%eax
.byte 71 // inc %edi
- .byte 225,61 // loope 93d1 <.literal16+0x261>
+ .byte 225,61 // loope 70e1 <.literal16+0x261>
.byte 174 // scas %es:(%edi),%al
.byte 71 // inc %edi
- .byte 225,61 // loope 93d5 <.literal16+0x265>
+ .byte 225,61 // loope 70e5 <.literal16+0x265>
.byte 174 // scas %es:(%edi),%al
.byte 71 // inc %edi
- .byte 225,61 // loope 93d9 <.literal16+0x269>
+ .byte 225,61 // loope 70e9 <.literal16+0x269>
.byte 174 // scas %es:(%edi),%al
.byte 71 // inc %edi
- .byte 225,61 // loope 93dd <.literal16+0x26d>
+ .byte 225,61 // loope 70ed <.literal16+0x26d>
.byte 0,0 // add %al,(%eax)
.byte 128,63,0 // cmpb $0x0,(%edi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax)
@@ -60468,16 +58030,16 @@ BALIGN16
.byte 63 // aas
.byte 61,10,23,63,174 // cmp $0xae3f170a,%eax
.byte 71 // inc %edi
- .byte 225,61 // loope 9411 <.literal16+0x2a1>
+ .byte 225,61 // loope 7121 <.literal16+0x2a1>
.byte 174 // scas %es:(%edi),%al
.byte 71 // inc %edi
- .byte 225,61 // loope 9415 <.literal16+0x2a5>
+ .byte 225,61 // loope 7125 <.literal16+0x2a5>
.byte 174 // scas %es:(%edi),%al
.byte 71 // inc %edi
- .byte 225,61 // loope 9419 <.literal16+0x2a9>
+ .byte 225,61 // loope 7129 <.literal16+0x2a9>
.byte 174 // scas %es:(%edi),%al
.byte 71 // inc %edi
- .byte 225,61 // loope 941d <.literal16+0x2ad>
+ .byte 225,61 // loope 712d <.literal16+0x2ad>
.byte 0,0 // add %al,(%eax)
.byte 128,63,0 // cmpb $0x0,(%edi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax)
@@ -60494,16 +58056,16 @@ BALIGN16
.byte 63 // aas
.byte 61,10,23,63,174 // cmp $0xae3f170a,%eax
.byte 71 // inc %edi
- .byte 225,61 // loope 9451 <.literal16+0x2e1>
+ .byte 225,61 // loope 7161 <.literal16+0x2e1>
.byte 174 // scas %es:(%edi),%al
.byte 71 // inc %edi
- .byte 225,61 // loope 9455 <.literal16+0x2e5>
+ .byte 225,61 // loope 7165 <.literal16+0x2e5>
.byte 174 // scas %es:(%edi),%al
.byte 71 // inc %edi
- .byte 225,61 // loope 9459 <.literal16+0x2e9>
+ .byte 225,61 // loope 7169 <.literal16+0x2e9>
.byte 174 // scas %es:(%edi),%al
.byte 71 // inc %edi
- .byte 225,61 // loope 945d <.literal16+0x2ed>
+ .byte 225,61 // loope 716d <.literal16+0x2ed>
.byte 0,0 // add %al,(%eax)
.byte 128,63,0 // cmpb $0x0,(%edi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax)
@@ -60525,11 +58087,11 @@ BALIGN16
.byte 0,128,63,0,0,127 // add %al,0x7f00003f(%eax)
.byte 67 // inc %ebx
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 949b <.literal16+0x32b>
+ .byte 127,67 // jg 71ab <.literal16+0x32b>
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 949f <.literal16+0x32f>
+ .byte 127,67 // jg 71af <.literal16+0x32f>
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 94a3 <.literal16+0x333>
+ .byte 127,67 // jg 71b3 <.literal16+0x333>
.byte 0,0 // add %al,(%eax)
.byte 128,63,0 // cmpb $0x0,(%edi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax)
@@ -60798,13 +58360,13 @@ BALIGN16
.byte 132,55 // test %dh,(%edi)
.byte 8,33 // or %ah,(%ecx)
.byte 132,55 // test %dh,(%edi)
- .byte 224,7 // loopne 96e9 <.literal16+0x579>
+ .byte 224,7 // loopne 73f9 <.literal16+0x579>
.byte 0,0 // add %al,(%eax)
- .byte 224,7 // loopne 96ed <.literal16+0x57d>
+ .byte 224,7 // loopne 73fd <.literal16+0x57d>
.byte 0,0 // add %al,(%eax)
- .byte 224,7 // loopne 96f1 <.literal16+0x581>
+ .byte 224,7 // loopne 7401 <.literal16+0x581>
.byte 0,0 // add %al,(%eax)
- .byte 224,7 // loopne 96f5 <.literal16+0x585>
+ .byte 224,7 // loopne 7405 <.literal16+0x585>
.byte 0,0 // add %al,(%eax)
.byte 33,8 // and %ecx,(%eax)
.byte 2,58 // add (%edx),%bh
@@ -60853,11 +58415,11 @@ BALIGN16
.byte 128,63,0 // cmpb $0x0,(%edi)
.byte 0,127,67 // add %bh,0x43(%edi)
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 97ab <.literal16+0x63b>
+ .byte 127,67 // jg 74bb <.literal16+0x63b>
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 97af <.literal16+0x63f>
+ .byte 127,67 // jg 74bf <.literal16+0x63f>
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 97b3 <.literal16+0x643>
+ .byte 127,67 // jg 74c3 <.literal16+0x643>
.byte 129,128,128,59,129,128,128,59,129,128// addl $0x80813b80,-0x7f7ec480(%eax)
.byte 128,59,129 // cmpb $0x81,(%ebx)
.byte 128,128,59,129,128,128,59 // addb $0x3b,-0x7f7f7ec5(%eax)
@@ -60872,16 +58434,16 @@ BALIGN16
.byte 0,0 // add %al,(%eax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 97a4 <.literal16+0x634>
+ .byte 127,0 // jg 74b4 <.literal16+0x634>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 97a8 <.literal16+0x638>
+ .byte 127,0 // jg 74b8 <.literal16+0x638>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 97ac <.literal16+0x63c>
+ .byte 127,0 // jg 74bc <.literal16+0x63c>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 97b0 <.literal16+0x640>
+ .byte 127,0 // jg 74c0 <.literal16+0x640>
.byte 0,0 // add %al,(%eax)
.byte 0,63 // add %bh,(%edi)
.byte 0,0 // add %al,(%eax)
@@ -60890,7 +58452,7 @@ BALIGN16
.byte 0,63 // add %bh,(%edi)
.byte 0,0 // add %al,(%eax)
.byte 0,63 // add %bh,(%edi)
- .byte 119,115 // ja 9835 <.literal16+0x6c5>
+ .byte 119,115 // ja 7545 <.literal16+0x6c5>
.byte 248 // clc
.byte 194,119,115 // ret $0x7377
.byte 248 // clc
@@ -60901,7 +58463,7 @@ BALIGN16
.byte 194,117,191 // ret $0xbf75
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // aas
- .byte 117,191 // jne 9799 <.literal16+0x629>
+ .byte 117,191 // jne 74a9 <.literal16+0x629>
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // aas
.byte 249 // stc
@@ -60917,7 +58479,7 @@ BALIGN16
.byte 68 // inc %esp
.byte 180,62 // mov $0x3e,%ah
.byte 163,233,220,63,163 // mov %eax,0xa33fdce9
- .byte 233,220,63,163,233 // jmp e9a3d7d6 <_sk_callback_sse2+0xe9a34754>
+ .byte 233,220,63,163,233 // jmp e9a3b4e6 <_sk_callback_sse2+0xe9a34723>
.byte 220,63 // fdivrl (%edi)
.byte 163,233,220,63,0 // mov %eax,0x3fdce9
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax)
@@ -60972,16 +58534,16 @@ BALIGN16
.byte 0,0 // add %al,(%eax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 9874 <.literal16+0x704>
+ .byte 127,0 // jg 7584 <.literal16+0x704>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 9878 <.literal16+0x708>
+ .byte 127,0 // jg 7588 <.literal16+0x708>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 987c <.literal16+0x70c>
+ .byte 127,0 // jg 758c <.literal16+0x70c>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 9880 <.literal16+0x710>
+ .byte 127,0 // jg 7590 <.literal16+0x710>
.byte 0,0 // add %al,(%eax)
.byte 0,63 // add %bh,(%edi)
.byte 0,0 // add %al,(%eax)
@@ -60990,7 +58552,7 @@ BALIGN16
.byte 0,63 // add %bh,(%edi)
.byte 0,0 // add %al,(%eax)
.byte 0,63 // add %bh,(%edi)
- .byte 119,115 // ja 9905 <.literal16+0x795>
+ .byte 119,115 // ja 7615 <.literal16+0x795>
.byte 248 // clc
.byte 194,119,115 // ret $0x7377
.byte 248 // clc
@@ -61001,7 +58563,7 @@ BALIGN16
.byte 194,117,191 // ret $0xbf75
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // aas
- .byte 117,191 // jne 9869 <.literal16+0x6f9>
+ .byte 117,191 // jne 7579 <.literal16+0x6f9>
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // aas
.byte 249 // stc
@@ -61017,7 +58579,7 @@ BALIGN16
.byte 68 // inc %esp
.byte 180,62 // mov $0x3e,%ah
.byte 163,233,220,63,163 // mov %eax,0xa33fdce9
- .byte 233,220,63,163,233 // jmp e9a3d8a6 <_sk_callback_sse2+0xe9a34824>
+ .byte 233,220,63,163,233 // jmp e9a3b5b6 <_sk_callback_sse2+0xe9a347f3>
.byte 220,63 // fdivrl (%edi)
.byte 163,233,220,63,0 // mov %eax,0x3fdce9
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax)
@@ -61072,16 +58634,16 @@ BALIGN16
.byte 0,0 // add %al,(%eax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 9944 <.literal16+0x7d4>
+ .byte 127,0 // jg 7654 <.literal16+0x7d4>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 9948 <.literal16+0x7d8>
+ .byte 127,0 // jg 7658 <.literal16+0x7d8>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 994c <.literal16+0x7dc>
+ .byte 127,0 // jg 765c <.literal16+0x7dc>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 9950 <.literal16+0x7e0>
+ .byte 127,0 // jg 7660 <.literal16+0x7e0>
.byte 0,0 // add %al,(%eax)
.byte 0,63 // add %bh,(%edi)
.byte 0,0 // add %al,(%eax)
@@ -61090,7 +58652,7 @@ BALIGN16
.byte 0,63 // add %bh,(%edi)
.byte 0,0 // add %al,(%eax)
.byte 0,63 // add %bh,(%edi)
- .byte 119,115 // ja 99d5 <.literal16+0x865>
+ .byte 119,115 // ja 76e5 <.literal16+0x865>
.byte 248 // clc
.byte 194,119,115 // ret $0x7377
.byte 248 // clc
@@ -61101,7 +58663,7 @@ BALIGN16
.byte 194,117,191 // ret $0xbf75
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // aas
- .byte 117,191 // jne 9939 <.literal16+0x7c9>
+ .byte 117,191 // jne 7649 <.literal16+0x7c9>
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // aas
.byte 249 // stc
@@ -61117,7 +58679,7 @@ BALIGN16
.byte 68 // inc %esp
.byte 180,62 // mov $0x3e,%ah
.byte 163,233,220,63,163 // mov %eax,0xa33fdce9
- .byte 233,220,63,163,233 // jmp e9a3d976 <_sk_callback_sse2+0xe9a348f4>
+ .byte 233,220,63,163,233 // jmp e9a3b686 <_sk_callback_sse2+0xe9a348c3>
.byte 220,63 // fdivrl (%edi)
.byte 163,233,220,63,0 // mov %eax,0x3fdce9
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax)
@@ -61172,16 +58734,16 @@ BALIGN16
.byte 0,0 // add %al,(%eax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 9a14 <.literal16+0x8a4>
+ .byte 127,0 // jg 7724 <.literal16+0x8a4>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 9a18 <.literal16+0x8a8>
+ .byte 127,0 // jg 7728 <.literal16+0x8a8>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 9a1c <.literal16+0x8ac>
+ .byte 127,0 // jg 772c <.literal16+0x8ac>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 9a20 <.literal16+0x8b0>
+ .byte 127,0 // jg 7730 <.literal16+0x8b0>
.byte 0,0 // add %al,(%eax)
.byte 0,63 // add %bh,(%edi)
.byte 0,0 // add %al,(%eax)
@@ -61190,7 +58752,7 @@ BALIGN16
.byte 0,63 // add %bh,(%edi)
.byte 0,0 // add %al,(%eax)
.byte 0,63 // add %bh,(%edi)
- .byte 119,115 // ja 9aa5 <.literal16+0x935>
+ .byte 119,115 // ja 77b5 <.literal16+0x935>
.byte 248 // clc
.byte 194,119,115 // ret $0x7377
.byte 248 // clc
@@ -61201,7 +58763,7 @@ BALIGN16
.byte 194,117,191 // ret $0xbf75
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // aas
- .byte 117,191 // jne 9a09 <.literal16+0x899>
+ .byte 117,191 // jne 7719 <.literal16+0x899>
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // aas
.byte 249 // stc
@@ -61217,7 +58779,7 @@ BALIGN16
.byte 68 // inc %esp
.byte 180,62 // mov $0x3e,%ah
.byte 163,233,220,63,163 // mov %eax,0xa33fdce9
- .byte 233,220,63,163,233 // jmp e9a3da46 <_sk_callback_sse2+0xe9a349c4>
+ .byte 233,220,63,163,233 // jmp e9a3b756 <_sk_callback_sse2+0xe9a34993>
.byte 220,63 // fdivrl (%edi)
.byte 163,233,220,63,0 // mov %eax,0x3fdce9
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax)
@@ -61268,13 +58830,13 @@ BALIGN16
.byte 200,66,0,0 // enter $0x42,$0x0
.byte 200,66,0,0 // enter $0x42,$0x0
.byte 200,66,0,0 // enter $0x42,$0x0
- .byte 127,67 // jg 9b27 <.literal16+0x9b7>
+ .byte 127,67 // jg 7837 <.literal16+0x9b7>
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 9b2b <.literal16+0x9bb>
+ .byte 127,67 // jg 783b <.literal16+0x9bb>
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 9b2f <.literal16+0x9bf>
+ .byte 127,67 // jg 783f <.literal16+0x9bf>
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 9b33 <.literal16+0x9c3>
+ .byte 127,67 // jg 7843 <.literal16+0x9c3>
.byte 0,0 // add %al,(%eax)
.byte 0,195 // add %al,%bl
.byte 0,0 // add %al,(%eax)
@@ -61325,16 +58887,16 @@ BALIGN16
.byte 128,3,62 // addb $0x3e,(%ebx)
.byte 31 // pop %ds
.byte 215 // xlat %ds:(%ebx)
- .byte 118,63 // jbe 9bb3 <.literal16+0xa43>
+ .byte 118,63 // jbe 78c3 <.literal16+0xa43>
.byte 31 // pop %ds
.byte 215 // xlat %ds:(%ebx)
- .byte 118,63 // jbe 9bb7 <.literal16+0xa47>
+ .byte 118,63 // jbe 78c7 <.literal16+0xa47>
.byte 31 // pop %ds
.byte 215 // xlat %ds:(%ebx)
- .byte 118,63 // jbe 9bbb <.literal16+0xa4b>
+ .byte 118,63 // jbe 78cb <.literal16+0xa4b>
.byte 31 // pop %ds
.byte 215 // xlat %ds:(%ebx)
- .byte 118,63 // jbe 9bbf <.literal16+0xa4f>
+ .byte 118,63 // jbe 78cf <.literal16+0xa4f>
.byte 246,64,83,63 // testb $0x3f,0x53(%eax)
.byte 246,64,83,63 // testb $0x3f,0x53(%eax)
.byte 246,64,83,63 // testb $0x3f,0x53(%eax)
@@ -61363,11 +58925,11 @@ BALIGN16
.byte 128,59,0 // cmpb $0x0,(%ebx)
.byte 0,127,67 // add %bh,0x43(%edi)
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 9c2b <.literal16+0xabb>
+ .byte 127,67 // jg 793b <.literal16+0xabb>
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 9c2f <.literal16+0xabf>
+ .byte 127,67 // jg 793f <.literal16+0xabf>
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 9c33 <.literal16+0xac3>
+ .byte 127,67 // jg 7943 <.literal16+0xac3>
.byte 255,0 // incl (%eax)
.byte 0,0 // add %al,(%eax)
.byte 0,0 // add %al,(%eax)
@@ -61429,13 +58991,13 @@ BALIGN16
.byte 132,55 // test %dh,(%edi)
.byte 8,33 // or %ah,(%ecx)
.byte 132,55 // test %dh,(%edi)
- .byte 224,7 // loopne 9ca9 <.literal16+0xb39>
+ .byte 224,7 // loopne 79b9 <.literal16+0xb39>
.byte 0,0 // add %al,(%eax)
- .byte 224,7 // loopne 9cad <.literal16+0xb3d>
+ .byte 224,7 // loopne 79bd <.literal16+0xb3d>
.byte 0,0 // add %al,(%eax)
- .byte 224,7 // loopne 9cb1 <.literal16+0xb41>
+ .byte 224,7 // loopne 79c1 <.literal16+0xb41>
.byte 0,0 // add %al,(%eax)
- .byte 224,7 // loopne 9cb5 <.literal16+0xb45>
+ .byte 224,7 // loopne 79c5 <.literal16+0xb45>
.byte 0,0 // add %al,(%eax)
.byte 33,8 // and %ecx,(%eax)
.byte 2,58 // add (%edx),%bh
@@ -61481,13 +59043,13 @@ BALIGN16
.byte 132,55 // test %dh,(%edi)
.byte 8,33 // or %ah,(%ecx)
.byte 132,55 // test %dh,(%edi)
- .byte 224,7 // loopne 9d19 <.literal16+0xba9>
+ .byte 224,7 // loopne 7a29 <.literal16+0xba9>
.byte 0,0 // add %al,(%eax)
- .byte 224,7 // loopne 9d1d <.literal16+0xbad>
+ .byte 224,7 // loopne 7a2d <.literal16+0xbad>
.byte 0,0 // add %al,(%eax)
- .byte 224,7 // loopne 9d21 <.literal16+0xbb1>
+ .byte 224,7 // loopne 7a31 <.literal16+0xbb1>
.byte 0,0 // add %al,(%eax)
- .byte 224,7 // loopne 9d25 <.literal16+0xbb5>
+ .byte 224,7 // loopne 7a35 <.literal16+0xbb5>
.byte 0,0 // add %al,(%eax)
.byte 33,8 // and %ecx,(%eax)
.byte 2,58 // add (%edx),%bh
@@ -61533,13 +59095,13 @@ BALIGN16
.byte 132,55 // test %dh,(%edi)
.byte 8,33 // or %ah,(%ecx)
.byte 132,55 // test %dh,(%edi)
- .byte 224,7 // loopne 9d89 <.literal16+0xc19>
+ .byte 224,7 // loopne 7a99 <.literal16+0xc19>
.byte 0,0 // add %al,(%eax)
- .byte 224,7 // loopne 9d8d <.literal16+0xc1d>
+ .byte 224,7 // loopne 7a9d <.literal16+0xc1d>
.byte 0,0 // add %al,(%eax)
- .byte 224,7 // loopne 9d91 <.literal16+0xc21>
+ .byte 224,7 // loopne 7aa1 <.literal16+0xc21>
.byte 0,0 // add %al,(%eax)
- .byte 224,7 // loopne 9d95 <.literal16+0xc25>
+ .byte 224,7 // loopne 7aa5 <.literal16+0xc25>
.byte 0,0 // add %al,(%eax)
.byte 33,8 // and %ecx,(%eax)
.byte 2,58 // add (%edx),%bh
@@ -61581,13 +59143,13 @@ BALIGN16
.byte 248 // clc
.byte 65 // inc %ecx
.byte 0,0 // add %al,(%eax)
- .byte 124,66 // jl 9e26 <.literal16+0xcb6>
+ .byte 124,66 // jl 7b36 <.literal16+0xcb6>
.byte 0,0 // add %al,(%eax)
- .byte 124,66 // jl 9e2a <.literal16+0xcba>
+ .byte 124,66 // jl 7b3a <.literal16+0xcba>
.byte 0,0 // add %al,(%eax)
- .byte 124,66 // jl 9e2e <.literal16+0xcbe>
+ .byte 124,66 // jl 7b3e <.literal16+0xcbe>
.byte 0,0 // add %al,(%eax)
- .byte 124,66 // jl 9e32 <.literal16+0xcc2>
+ .byte 124,66 // jl 7b42 <.literal16+0xcc2>
.byte 0,240 // add %dh,%al
.byte 0,0 // add %al,(%eax)
.byte 0,240 // add %dh,%al
@@ -61721,13 +59283,13 @@ BALIGN16
.byte 136,136,61,137,136,136 // mov %cl,-0x777776c3(%eax)
.byte 61,137,136,136,61 // cmp $0x3d888889,%eax
.byte 0,0 // add %al,(%eax)
- .byte 112,65 // jo 9fb5 <.literal16+0xe45>
+ .byte 112,65 // jo 7cc5 <.literal16+0xe45>
.byte 0,0 // add %al,(%eax)
- .byte 112,65 // jo 9fb9 <.literal16+0xe49>
+ .byte 112,65 // jo 7cc9 <.literal16+0xe49>
.byte 0,0 // add %al,(%eax)
- .byte 112,65 // jo 9fbd <.literal16+0xe4d>
+ .byte 112,65 // jo 7ccd <.literal16+0xe4d>
.byte 0,0 // add %al,(%eax)
- .byte 112,65 // jo 9fc1 <.literal16+0xe51>
+ .byte 112,65 // jo 7cd1 <.literal16+0xe51>
.byte 255,0 // incl (%eax)
.byte 0,0 // add %al,(%eax)
.byte 255,0 // incl (%eax)
@@ -61758,11 +59320,11 @@ BALIGN16
.byte 128,59,129 // cmpb $0x81,(%ebx)
.byte 128,128,59,0,0,127,67 // addb $0x43,0x7f00003b(%eax)
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg a02b <.literal16+0xebb>
+ .byte 127,67 // jg 7d3b <.literal16+0xebb>
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg a02f <.literal16+0xebf>
+ .byte 127,67 // jg 7d3f <.literal16+0xebf>
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg a033 <.literal16+0xec3>
+ .byte 127,67 // jg 7d43 <.literal16+0xec3>
.byte 255,0 // incl (%eax)
.byte 0,0 // add %al,(%eax)
.byte 255,0 // incl (%eax)
@@ -61793,11 +59355,11 @@ BALIGN16
.byte 128,59,129 // cmpb $0x81,(%ebx)
.byte 128,128,59,0,0,127,67 // addb $0x43,0x7f00003b(%eax)
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg a09b <.literal16+0xf2b>
+ .byte 127,67 // jg 7dab <.literal16+0xf2b>
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg a09f <.literal16+0xf2f>
+ .byte 127,67 // jg 7daf <.literal16+0xf2f>
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg a0a3 <.literal16+0xf33>
+ .byte 127,67 // jg 7db3 <.literal16+0xf33>
.byte 0,128,0,0,0,128 // add %al,-0x80000000(%eax)
.byte 0,0 // add %al,(%eax)
.byte 0,128,0,0,0,128 // add %al,-0x80000000(%eax)
@@ -61896,13 +59458,13 @@ BALIGN16
.byte 0,0 // add %al,(%eax)
.byte 128,63,0 // cmpb $0x0,(%edi)
.byte 255 // (bad)
- .byte 127,71 // jg a1cb <.literal16+0x105b>
+ .byte 127,71 // jg 7edb <.literal16+0x105b>
.byte 0,255 // add %bh,%bh
- .byte 127,71 // jg a1cf <.literal16+0x105f>
+ .byte 127,71 // jg 7edf <.literal16+0x105f>
.byte 0,255 // add %bh,%bh
- .byte 127,71 // jg a1d3 <.literal16+0x1063>
+ .byte 127,71 // jg 7ee3 <.literal16+0x1063>
.byte 0,255 // add %bh,%bh
- .byte 127,71 // jg a1d7 <.literal16+0x1067>
+ .byte 127,71 // jg 7ee7 <.literal16+0x1067>
.byte 0,0 // add %al,(%eax)
.byte 128,63,0 // cmpb $0x0,(%edi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax)
@@ -62010,7 +59572,7 @@ BALIGN16
.byte 192,45,16,17,192,45,16 // shrb $0x10,0x2dc01110
.byte 17,192 // adc %eax,%eax
.byte 45,16,17,192,18 // sub $0x12c01110,%eax
- .byte 120,57 // js a2dc <.literal16+0x116c>
+ .byte 120,57 // js 7fec <.literal16+0x116c>
.byte 64 // inc %eax
.byte 18,120,57 // adc 0x39(%eax),%bh
.byte 64 // inc %eax
@@ -62203,11 +59765,11 @@ BALIGN16
.byte 0,0 // add %al,(%eax)
.byte 128,63,114 // cmpb $0x72,(%edi)
.byte 28,199 // sbb $0xc7,%al
- .byte 62,114,28 // jb,pt a4c2 <.literal16+0x1352>
+ .byte 62,114,28 // jb,pt 81d2 <.literal16+0x1352>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt a4c6 <.literal16+0x1356>
+ .byte 62,114,28 // jb,pt 81d6 <.literal16+0x1356>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt a4ca <.literal16+0x135a>
+ .byte 62,114,28 // jb,pt 81da <.literal16+0x135a>
.byte 199 // (bad)
.byte 62,171 // ds stos %eax,%es:(%edi)
.byte 170 // stos %al,%es:(%edi)
@@ -62286,13 +59848,13 @@ BALIGN16
.byte 192,63,0 // sarb $0x0,(%edi)
.byte 0,192 // add %al,%al
.byte 63 // aas
- .byte 114,28 // jb a58e <.literal16+0x141e>
+ .byte 114,28 // jb 829e <.literal16+0x141e>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt a592 <.literal16+0x1422>
+ .byte 62,114,28 // jb,pt 82a2 <.literal16+0x1422>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt a596 <.literal16+0x1426>
+ .byte 62,114,28 // jb,pt 82a6 <.literal16+0x1426>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt a59a <.literal16+0x142a>
+ .byte 62,114,28 // jb,pt 82aa <.literal16+0x142a>
.byte 199 // (bad)
.byte 62,171 // ds stos %eax,%es:(%edi)
.byte 170 // stos %al,%es:(%edi)
@@ -62313,11 +59875,11 @@ BALIGN16
.byte 0,0 // add %al,(%eax)
.byte 128,63,114 // cmpb $0x72,(%edi)
.byte 28,199 // sbb $0xc7,%al
- .byte 62,114,28 // jb,pt a5d2 <.literal16+0x1462>
+ .byte 62,114,28 // jb,pt 82e2 <.literal16+0x1462>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt a5d6 <.literal16+0x1466>
+ .byte 62,114,28 // jb,pt 82e6 <.literal16+0x1466>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt a5da <.literal16+0x146a>
+ .byte 62,114,28 // jb,pt 82ea <.literal16+0x146a>
.byte 199 // (bad)
.byte 62,171 // ds stos %eax,%es:(%edi)
.byte 170 // stos %al,%es:(%edi)
@@ -62396,13 +59958,13 @@ BALIGN16
.byte 192,63,0 // sarb $0x0,(%edi)
.byte 0,192 // add %al,%al
.byte 63 // aas
- .byte 114,28 // jb a69e <.literal16+0x152e>
+ .byte 114,28 // jb 83ae <.literal16+0x152e>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt a6a2 <_sk_callback_sse2+0x1620>
+ .byte 62,114,28 // jb,pt 83b2 <_sk_callback_sse2+0x15ef>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt a6a6 <_sk_callback_sse2+0x1624>
+ .byte 62,114,28 // jb,pt 83b6 <_sk_callback_sse2+0x15f3>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt a6aa <_sk_callback_sse2+0x1628>
+ .byte 62,114,28 // jb,pt 83ba <_sk_callback_sse2+0x15f7>
.byte 199 // (bad)
.byte 62,171 // ds stos %eax,%es:(%edi)
.byte 170 // stos %al,%es:(%edi)
diff --git a/src/jumper/SkJumper_generated_win.S b/src/jumper/SkJumper_generated_win.S
index d4531357f1..539e5c9451 100644
--- a/src/jumper/SkJumper_generated_win.S
+++ b/src/jumper/SkJumper_generated_win.S
@@ -36129,56 +36129,55 @@ _sk_start_pipeline_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,228,240 ; and $0xfffffff0,%esp
- DB 131,236,16 ; sub $0x10,%esp
- DB 139,117,12 ; mov 0xc(%ebp),%esi
- DB 59,117,20 ; cmp 0x14(%ebp),%esi
- DB 115,112 ; jae 84 <_sk_start_pipeline_sse2+0x84>
- DB 139,85,28 ; mov 0x1c(%ebp),%edx
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,93,24 ; mov 0x18(%ebp),%ebx
- DB 139,59 ; mov (%ebx),%edi
- DB 131,195,4 ; add $0x4,%ebx
- DB 141,64,4 ; lea 0x4(%eax),%eax
- DB 137,68,36,8 ; mov %eax,0x8(%esp)
- DB 137,116,36,4 ; mov %esi,0x4(%esp)
- DB 57,76,36,8 ; cmp %ecx,0x8(%esp)
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 137,222 ; mov %ebx,%esi
- DB 119,38 ; ja 61 <_sk_start_pipeline_sse2+0x61>
- DB 139,93,8 ; mov 0x8(%ebp),%ebx
- DB 131,236,76 ; sub $0x4c,%esp
- DB 106,0 ; push $0x0
- DB 255,116,36,84 ; pushl 0x54(%esp)
- DB 83 ; push %ebx
+ DB 131,236,112 ; sub $0x70,%esp
+ DB 139,69,12 ; mov 0xc(%ebp),%eax
+ DB 59,69,20 ; cmp 0x14(%ebp),%eax
+ DB 15,131,131,0,0,0 ; jae 9b <_sk_start_pipeline_sse2+0x9b>
+ DB 139,85,16 ; mov 0x10(%ebp),%edx
+ DB 139,77,8 ; mov 0x8(%ebp),%ecx
+ DB 139,117,24 ; mov 0x18(%ebp),%esi
+ DB 139,62 ; mov (%esi),%edi
+ DB 131,198,4 ; add $0x4,%esi
+ DB 141,73,4 ; lea 0x4(%ecx),%ecx
+ DB 137,76,36,8 ; mov %ecx,0x8(%esp)
+ DB 57,84,36,8 ; cmp %edx,0x8(%esp)
+ DB 139,77,8 ; mov 0x8(%ebp),%ecx
+ DB 137,76,36,16 ; mov %ecx,0x10(%esp)
+ DB 137,68,36,12 ; mov %eax,0xc(%esp)
+ DB 137,68,36,20 ; mov %eax,0x14(%esp)
+ DB 199,68,36,24,0,0,0,0 ; movl $0x0,0x18(%esp)
+ DB 139,69,28 ; mov 0x1c(%ebp),%eax
+ DB 137,68,36,28 ; mov %eax,0x1c(%esp)
+ DB 137,200 ; mov %ecx,%eax
+ DB 141,92,36,16 ; lea 0x10(%esp),%ebx
+ DB 119,31 ; ja 76 <_sk_start_pipeline_sse2+0x76>
+ DB 131,236,8 ; sub $0x8,%esp
DB 86 ; push %esi
- DB 82 ; push %edx
+ DB 83 ; push %ebx
DB 255,215 ; call *%edi
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
- DB 139,85,28 ; mov 0x1c(%ebp),%edx
- DB 131,196,96 ; add $0x60,%esp
- DB 141,67,4 ; lea 0x4(%ebx),%eax
- DB 131,195,8 ; add $0x8,%ebx
- DB 57,203 ; cmp %ecx,%ebx
- DB 137,195 ; mov %eax,%ebx
- DB 118,221 ; jbe 3e <_sk_start_pipeline_sse2+0x3e>
+ DB 139,85,16 ; mov 0x10(%ebp),%edx
+ DB 131,196,16 ; add $0x10,%esp
+ DB 139,76,36,16 ; mov 0x10(%esp),%ecx
+ DB 141,65,4 ; lea 0x4(%ecx),%eax
+ DB 137,68,36,16 ; mov %eax,0x10(%esp)
+ DB 131,193,8 ; add $0x8,%ecx
+ DB 57,209 ; cmp %edx,%ecx
+ DB 118,225 ; jbe 57 <_sk_start_pipeline_sse2+0x57>
+ DB 137,209 ; mov %edx,%ecx
DB 41,193 ; sub %eax,%ecx
- DB 137,243 ; mov %esi,%ebx
- DB 139,116,36,4 ; mov 0x4(%esp),%esi
- DB 116,16 ; je 7b <_sk_start_pipeline_sse2+0x7b>
- DB 131,236,76 ; sub $0x4c,%esp
- DB 81 ; push %ecx
+ DB 116,21 ; je 91 <_sk_start_pipeline_sse2+0x91>
+ DB 137,76,36,24 ; mov %ecx,0x18(%esp)
+ DB 131,236,8 ; sub $0x8,%esp
DB 86 ; push %esi
+ DB 141,68,36,28 ; lea 0x1c(%esp),%eax
DB 80 ; push %eax
- DB 83 ; push %ebx
- DB 82 ; push %edx
DB 255,215 ; call *%edi
- DB 139,85,28 ; mov 0x1c(%ebp),%edx
- DB 131,196,96 ; add $0x60,%esp
- DB 70 ; inc %esi
- DB 59,117,20 ; cmp 0x14(%ebp),%esi
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
- DB 117,168 ; jne 2c <_sk_start_pipeline_sse2+0x2c>
+ DB 139,85,16 ; mov 0x10(%ebp),%edx
+ DB 131,196,16 ; add $0x10,%esp
+ DB 139,68,36,12 ; mov 0xc(%esp),%eax
+ DB 64 ; inc %eax
+ DB 59,69,20 ; cmp 0x14(%ebp),%eax
+ DB 117,146 ; jne 2d <_sk_start_pipeline_sse2+0x2d>
DB 141,101,244 ; lea -0xc(%ebp),%esp
DB 94 ; pop %esi
DB 95 ; pop %edi
@@ -36194,47 +36193,38 @@ PUBLIC _sk_seed_shader_sse2
_sk_seed_shader_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 232,0,0,0,0 ; call 9b <_sk_seed_shader_sse2+0xe>
- DB 89 ; pop %ecx
- DB 139,85,20 ; mov 0x14(%ebp),%edx
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,125,16 ; mov 0x10(%ebp),%edi
- DB 102,15,110,199 ; movd %edi,%xmm0
+ DB 80 ; push %eax
+ DB 232,0,0,0,0 ; call ae <_sk_seed_shader_sse2+0xa>
+ DB 88 ; pop %eax
+ DB 139,77,12 ; mov 0xc(%ebp),%ecx
+ DB 139,85,8 ; mov 0x8(%ebp),%edx
+ DB 139,114,12 ; mov 0xc(%edx),%esi
+ DB 102,15,110,2 ; movd (%edx),%xmm0
DB 102,15,112,192,0 ; pshufd $0x0,%xmm0,%xmm0
DB 15,91,200 ; cvtdq2ps %xmm0,%xmm1
- DB 15,40,145,213,144,0,0 ; movaps 0x90d5(%ecx),%xmm2
+ DB 15,40,144,226,109,0,0 ; movaps 0x6de2(%eax),%xmm2
DB 15,88,202 ; addps %xmm2,%xmm1
- DB 15,16,0 ; movups (%eax),%xmm0
+ DB 15,16,6 ; movups (%esi),%xmm0
DB 15,88,193 ; addps %xmm1,%xmm0
- DB 102,15,110,202 ; movd %edx,%xmm1
+ DB 102,15,110,74,4 ; movd 0x4(%edx),%xmm1
DB 102,15,112,201,0 ; pshufd $0x0,%xmm1,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
DB 15,88,202 ; addps %xmm2,%xmm1
- DB 139,93,12 ; mov 0xc(%ebp),%ebx
- DB 141,67,4 ; lea 0x4(%ebx),%eax
+ DB 141,113,4 ; lea 0x4(%ecx),%esi
DB 15,87,210 ; xorps %xmm2,%xmm2
- DB 15,41,84,36,80 ; movaps %xmm2,0x50(%esp)
- DB 15,41,84,36,64 ; movaps %xmm2,0x40(%esp)
- DB 15,41,84,36,48 ; movaps %xmm2,0x30(%esp)
- DB 15,41,84,36,32 ; movaps %xmm2,0x20(%esp)
- DB 139,117,24 ; mov 0x18(%ebp),%esi
- DB 137,116,36,16 ; mov %esi,0x10(%esp)
- DB 137,84,36,12 ; mov %edx,0xc(%esp)
- DB 137,124,36,8 ; mov %edi,0x8(%esp)
- DB 137,68,36,4 ; mov %eax,0x4(%esp)
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 137,4,36 ; mov %eax,(%esp)
- DB 15,40,145,229,144,0,0 ; movaps 0x90e5(%ecx),%xmm2
+ DB 15,41,82,64 ; movaps %xmm2,0x40(%edx)
+ DB 15,41,82,48 ; movaps %xmm2,0x30(%edx)
+ DB 15,41,82,32 ; movaps %xmm2,0x20(%edx)
+ DB 15,41,82,16 ; movaps %xmm2,0x10(%edx)
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 15,40,144,242,109,0,0 ; movaps 0x6df2(%eax),%xmm2
DB 15,87,219 ; xorps %xmm3,%xmm3
- DB 255,19 ; call *(%ebx)
- DB 131,196,108 ; add $0x6c,%esp
+ DB 86 ; push %esi
+ DB 82 ; push %edx
+ DB 255,17 ; call *(%ecx)
+ DB 131,196,20 ; add $0x14,%esp
DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
DB 93 ; pop %ebp
DB 195 ; ret
@@ -36242,93 +36232,75 @@ PUBLIC _sk_dither_sse2
_sk_dither_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
DB 86 ; push %esi
- DB 129,236,156,0,0,0 ; sub $0x9c,%esp
- DB 15,41,93,184 ; movaps %xmm3,-0x48(%ebp)
- DB 15,41,85,200 ; movaps %xmm2,-0x38(%ebp)
- DB 15,41,77,216 ; movaps %xmm1,-0x28(%ebp)
+ DB 131,236,36 ; sub $0x24,%esp
+ DB 15,41,93,216 ; movaps %xmm3,-0x28(%ebp)
+ DB 15,41,85,232 ; movaps %xmm2,-0x18(%ebp)
+ DB 15,40,217 ; movaps %xmm1,%xmm3
DB 15,40,208 ; movaps %xmm0,%xmm2
- DB 232,0,0,0,0 ; call 13a <_sk_dither_sse2+0x20>
- DB 94 ; pop %esi
- DB 139,77,20 ; mov 0x14(%ebp),%ecx
+ DB 232,0,0,0,0 ; call 12b <_sk_dither_sse2+0x1a>
+ DB 89 ; pop %ecx
DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,85,16 ; mov 0x10(%ebp),%edx
- DB 102,15,110,226 ; movd %edx,%xmm4
+ DB 139,80,12 ; mov 0xc(%eax),%edx
+ DB 102,15,110,32 ; movd (%eax),%xmm4
DB 102,15,112,228,0 ; pshufd $0x0,%xmm4,%xmm4
- DB 243,15,111,104,32 ; movdqu 0x20(%eax),%xmm5
+ DB 243,15,111,106,32 ; movdqu 0x20(%edx),%xmm5
DB 102,15,254,236 ; paddd %xmm4,%xmm5
- DB 102,15,110,225 ; movd %ecx,%xmm4
+ DB 102,15,110,96,4 ; movd 0x4(%eax),%xmm4
DB 102,15,112,252,0 ; pshufd $0x0,%xmm4,%xmm7
DB 102,15,239,253 ; pxor %xmm5,%xmm7
- DB 102,15,111,182,86,144,0,0 ; movdqa 0x9056(%esi),%xmm6
+ DB 102,15,111,177,133,109,0,0 ; movdqa 0x6d85(%ecx),%xmm6
DB 102,15,111,207 ; movdqa %xmm7,%xmm1
DB 102,15,219,206 ; pand %xmm6,%xmm1
DB 102,15,219,245 ; pand %xmm5,%xmm6
- DB 102,15,111,134,118,144,0,0 ; movdqa 0x9076(%esi),%xmm0
+ DB 102,15,111,129,165,109,0,0 ; movdqa 0x6da5(%ecx),%xmm0
DB 102,15,111,231 ; movdqa %xmm7,%xmm4
DB 102,15,219,224 ; pand %xmm0,%xmm4
DB 102,15,219,197 ; pand %xmm5,%xmm0
- DB 102,15,111,158,102,144,0,0 ; movdqa 0x9066(%esi),%xmm3
- DB 102,15,219,251 ; pand %xmm3,%xmm7
- DB 102,15,219,235 ; pand %xmm3,%xmm5
+ DB 102,15,219,185,149,109,0,0 ; pand 0x6d95(%ecx),%xmm7
+ DB 102,15,219,169,149,109,0,0 ; pand 0x6d95(%ecx),%xmm5
DB 102,15,114,246,4 ; pslld $0x4,%xmm6
DB 102,15,254,192 ; paddd %xmm0,%xmm0
DB 102,15,235,198 ; por %xmm6,%xmm0
DB 102,15,114,213,2 ; psrld $0x2,%xmm5
DB 102,15,235,197 ; por %xmm5,%xmm0
- DB 139,125,12 ; mov 0xc(%ebp),%edi
DB 102,15,114,241,5 ; pslld $0x5,%xmm1
DB 102,15,114,244,2 ; pslld $0x2,%xmm4
- DB 102,15,114,215,1 ; psrld $0x1,%xmm7
DB 102,15,235,225 ; por %xmm1,%xmm4
DB 102,15,235,224 ; por %xmm0,%xmm4
+ DB 139,85,12 ; mov 0xc(%ebp),%edx
+ DB 139,50 ; mov (%edx),%esi
+ DB 102,15,114,215,1 ; psrld $0x1,%xmm7
DB 102,15,235,231 ; por %xmm7,%xmm4
DB 15,91,196 ; cvtdq2ps %xmm4,%xmm0
- DB 15,89,134,134,144,0,0 ; mulps 0x9086(%esi),%xmm0
- DB 15,88,134,150,144,0,0 ; addps 0x9096(%esi),%xmm0
- DB 139,55 ; mov (%edi),%esi
+ DB 15,89,129,181,109,0,0 ; mulps 0x6db5(%ecx),%xmm0
+ DB 15,88,129,197,109,0,0 ; addps 0x6dc5(%ecx),%xmm0
DB 243,15,16,14 ; movss (%esi),%xmm1
- DB 139,117,24 ; mov 0x18(%ebp),%esi
- DB 15,40,117,40 ; movaps 0x28(%ebp),%xmm6
- DB 15,40,125,56 ; movaps 0x38(%ebp),%xmm7
DB 15,198,201,0 ; shufps $0x0,%xmm1,%xmm1
DB 15,89,200 ; mulps %xmm0,%xmm1
- DB 15,40,69,72 ; movaps 0x48(%ebp),%xmm0
DB 15,88,209 ; addps %xmm1,%xmm2
- DB 15,40,101,216 ; movaps -0x28(%ebp),%xmm4
- DB 15,88,225 ; addps %xmm1,%xmm4
- DB 15,88,77,200 ; addps -0x38(%ebp),%xmm1
- DB 15,40,93,184 ; movaps -0x48(%ebp),%xmm3
- DB 15,93,211 ; minps %xmm3,%xmm2
+ DB 15,88,217 ; addps %xmm1,%xmm3
+ DB 15,88,77,232 ; addps -0x18(%ebp),%xmm1
+ DB 15,40,69,216 ; movaps -0x28(%ebp),%xmm0
+ DB 15,93,208 ; minps %xmm0,%xmm2
DB 102,15,239,237 ; pxor %xmm5,%xmm5
DB 15,95,234 ; maxps %xmm2,%xmm5
- DB 15,93,227 ; minps %xmm3,%xmm4
- DB 15,40,212 ; movaps %xmm4,%xmm2
+ DB 15,93,216 ; minps %xmm0,%xmm3
DB 15,87,228 ; xorps %xmm4,%xmm4
- DB 15,95,226 ; maxps %xmm2,%xmm4
+ DB 15,95,227 ; maxps %xmm3,%xmm4
DB 15,87,210 ; xorps %xmm2,%xmm2
- DB 15,93,203 ; minps %xmm3,%xmm1
+ DB 15,93,200 ; minps %xmm0,%xmm1
+ DB 15,40,216 ; movaps %xmm0,%xmm3
DB 15,95,209 ; maxps %xmm1,%xmm2
- DB 15,40,77,88 ; movaps 0x58(%ebp),%xmm1
- DB 141,95,8 ; lea 0x8(%edi),%ebx
- DB 15,41,76,36,80 ; movaps %xmm1,0x50(%esp)
- DB 15,41,68,36,64 ; movaps %xmm0,0x40(%esp)
- DB 15,41,124,36,48 ; movaps %xmm7,0x30(%esp)
- DB 15,41,116,36,32 ; movaps %xmm6,0x20(%esp)
- DB 137,116,36,16 ; mov %esi,0x10(%esp)
- DB 137,76,36,12 ; mov %ecx,0xc(%esp)
- DB 137,84,36,8 ; mov %edx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
+ DB 141,74,8 ; lea 0x8(%edx),%ecx
+ DB 131,236,8 ; sub $0x8,%esp
DB 15,40,197 ; movaps %xmm5,%xmm0
DB 15,40,204 ; movaps %xmm4,%xmm1
- DB 255,87,4 ; call *0x4(%edi)
- DB 129,196,156,0,0,0 ; add $0x9c,%esp
+ DB 81 ; push %ecx
+ DB 80 ; push %eax
+ DB 255,82,4 ; call *0x4(%edx)
+ DB 131,196,52 ; add $0x34,%esp
DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
DB 93 ; pop %ebp
DB 195 ; ret
@@ -36336,43 +36308,23 @@ PUBLIC _sk_uniform_color_sse2
_sk_uniform_color_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
- DB 139,85,20 ; mov 0x14(%ebp),%edx
- DB 139,117,12 ; mov 0xc(%ebp),%esi
- DB 139,62 ; mov (%esi),%edi
- DB 243,15,16,7 ; movss (%edi),%xmm0
- DB 243,15,16,79,4 ; movss 0x4(%edi),%xmm1
- DB 243,15,16,87,8 ; movss 0x8(%edi),%xmm2
- DB 243,15,16,95,12 ; movss 0xc(%edi),%xmm3
- DB 139,125,24 ; mov 0x18(%ebp),%edi
- DB 15,40,101,40 ; movaps 0x28(%ebp),%xmm4
- DB 15,40,109,56 ; movaps 0x38(%ebp),%xmm5
- DB 15,40,117,72 ; movaps 0x48(%ebp),%xmm6
- DB 15,40,125,88 ; movaps 0x58(%ebp),%xmm7
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 139,69,12 ; mov 0xc(%ebp),%eax
+ DB 139,8 ; mov (%eax),%ecx
+ DB 243,15,16,1 ; movss (%ecx),%xmm0
+ DB 243,15,16,73,4 ; movss 0x4(%ecx),%xmm1
DB 15,198,192,0 ; shufps $0x0,%xmm0,%xmm0
DB 15,198,201,0 ; shufps $0x0,%xmm1,%xmm1
+ DB 243,15,16,81,8 ; movss 0x8(%ecx),%xmm2
DB 15,198,210,0 ; shufps $0x0,%xmm2,%xmm2
+ DB 243,15,16,89,12 ; movss 0xc(%ecx),%xmm3
DB 15,198,219,0 ; shufps $0x0,%xmm3,%xmm3
- DB 141,94,8 ; lea 0x8(%esi),%ebx
- DB 15,41,124,36,80 ; movaps %xmm7,0x50(%esp)
- DB 15,41,116,36,64 ; movaps %xmm6,0x40(%esp)
- DB 15,41,108,36,48 ; movaps %xmm5,0x30(%esp)
- DB 15,41,100,36,32 ; movaps %xmm4,0x20(%esp)
- DB 137,124,36,16 ; mov %edi,0x10(%esp)
- DB 137,84,36,12 ; mov %edx,0xc(%esp)
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
- DB 255,86,4 ; call *0x4(%esi)
- DB 131,196,108 ; add $0x6c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 141,72,8 ; lea 0x8(%eax),%ecx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 81 ; push %ecx
+ DB 255,117,8 ; pushl 0x8(%ebp)
+ DB 255,80,4 ; call *0x4(%eax)
+ DB 131,196,24 ; add $0x18,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -36380,40 +36332,20 @@ PUBLIC _sk_black_color_sse2
_sk_black_color_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 232,0,0,0,0 ; call 2ff <_sk_black_color_sse2+0xe>
- DB 89 ; pop %ecx
- DB 139,85,16 ; mov 0x10(%ebp),%edx
- DB 139,117,20 ; mov 0x14(%ebp),%esi
- DB 139,125,24 ; mov 0x18(%ebp),%edi
- DB 15,40,69,40 ; movaps 0x28(%ebp),%xmm0
- DB 15,40,77,56 ; movaps 0x38(%ebp),%xmm1
- DB 15,40,85,72 ; movaps 0x48(%ebp),%xmm2
- DB 15,40,93,88 ; movaps 0x58(%ebp),%xmm3
- DB 139,93,12 ; mov 0xc(%ebp),%ebx
- DB 141,67,4 ; lea 0x4(%ebx),%eax
- DB 15,41,92,36,80 ; movaps %xmm3,0x50(%esp)
- DB 15,41,84,36,64 ; movaps %xmm2,0x40(%esp)
- DB 15,41,76,36,48 ; movaps %xmm1,0x30(%esp)
- DB 15,41,68,36,32 ; movaps %xmm0,0x20(%esp)
- DB 137,124,36,16 ; mov %edi,0x10(%esp)
- DB 137,116,36,12 ; mov %esi,0xc(%esp)
- DB 137,84,36,8 ; mov %edx,0x8(%esp)
- DB 137,68,36,4 ; mov %eax,0x4(%esp)
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 137,4,36 ; mov %eax,(%esp)
- DB 15,40,153,225,142,0,0 ; movaps 0x8ee1(%ecx),%xmm3
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 232,0,0,0,0 ; call 26b <_sk_black_color_sse2+0xb>
+ DB 88 ; pop %eax
+ DB 139,77,12 ; mov 0xc(%ebp),%ecx
+ DB 141,81,4 ; lea 0x4(%ecx),%edx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 15,40,152,149,108,0,0 ; movaps 0x6c95(%eax),%xmm3
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 15,87,201 ; xorps %xmm1,%xmm1
DB 15,87,210 ; xorps %xmm2,%xmm2
- DB 255,19 ; call *(%ebx)
- DB 131,196,108 ; add $0x6c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 82 ; push %edx
+ DB 255,117,8 ; pushl 0x8(%ebp)
+ DB 255,17 ; call *(%ecx)
+ DB 131,196,24 ; add $0x18,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -36421,40 +36353,20 @@ PUBLIC _sk_white_color_sse2
_sk_white_color_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 232,0,0,0,0 ; call 371 <_sk_white_color_sse2+0xe>
- DB 89 ; pop %ecx
- DB 139,85,16 ; mov 0x10(%ebp),%edx
- DB 139,117,20 ; mov 0x14(%ebp),%esi
- DB 139,125,24 ; mov 0x18(%ebp),%edi
- DB 15,40,69,40 ; movaps 0x28(%ebp),%xmm0
- DB 15,40,77,56 ; movaps 0x38(%ebp),%xmm1
- DB 15,40,85,72 ; movaps 0x48(%ebp),%xmm2
- DB 15,40,93,88 ; movaps 0x58(%ebp),%xmm3
- DB 139,93,12 ; mov 0xc(%ebp),%ebx
- DB 141,67,4 ; lea 0x4(%ebx),%eax
- DB 15,41,92,36,80 ; movaps %xmm3,0x50(%esp)
- DB 15,41,84,36,64 ; movaps %xmm2,0x40(%esp)
- DB 15,41,76,36,48 ; movaps %xmm1,0x30(%esp)
- DB 15,41,68,36,32 ; movaps %xmm0,0x20(%esp)
- DB 137,124,36,16 ; mov %edi,0x10(%esp)
- DB 137,116,36,12 ; mov %esi,0xc(%esp)
- DB 137,84,36,8 ; mov %edx,0x8(%esp)
- DB 137,68,36,4 ; mov %eax,0x4(%esp)
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 137,4,36 ; mov %eax,(%esp)
- DB 15,40,129,127,142,0,0 ; movaps 0x8e7f(%ecx),%xmm0
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 232,0,0,0,0 ; call 29b <_sk_white_color_sse2+0xb>
+ DB 88 ; pop %eax
+ DB 139,77,12 ; mov 0xc(%ebp),%ecx
+ DB 141,81,4 ; lea 0x4(%ecx),%edx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 15,40,128,117,108,0,0 ; movaps 0x6c75(%eax),%xmm0
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 15,40,216 ; movaps %xmm0,%xmm3
- DB 255,19 ; call *(%ebx)
- DB 131,196,108 ; add $0x6c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 82 ; push %edx
+ DB 255,117,8 ; pushl 0x8(%ebp)
+ DB 255,17 ; call *(%ecx)
+ DB 131,196,24 ; add $0x18,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -36462,39 +36374,19 @@ PUBLIC _sk_load_rgba_sse2
_sk_load_rgba_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
- DB 139,85,20 ; mov 0x14(%ebp),%edx
- DB 139,117,12 ; mov 0xc(%ebp),%esi
- DB 139,62 ; mov (%esi),%edi
- DB 15,16,7 ; movups (%edi),%xmm0
- DB 15,16,79,16 ; movups 0x10(%edi),%xmm1
- DB 15,16,87,32 ; movups 0x20(%edi),%xmm2
- DB 15,16,95,48 ; movups 0x30(%edi),%xmm3
- DB 139,125,24 ; mov 0x18(%ebp),%edi
- DB 15,40,101,40 ; movaps 0x28(%ebp),%xmm4
- DB 15,40,109,56 ; movaps 0x38(%ebp),%xmm5
- DB 15,40,117,72 ; movaps 0x48(%ebp),%xmm6
- DB 15,40,125,88 ; movaps 0x58(%ebp),%xmm7
- DB 141,94,8 ; lea 0x8(%esi),%ebx
- DB 15,41,124,36,80 ; movaps %xmm7,0x50(%esp)
- DB 15,41,116,36,64 ; movaps %xmm6,0x40(%esp)
- DB 15,41,108,36,48 ; movaps %xmm5,0x30(%esp)
- DB 15,41,100,36,32 ; movaps %xmm4,0x20(%esp)
- DB 137,124,36,16 ; mov %edi,0x10(%esp)
- DB 137,84,36,12 ; mov %edx,0xc(%esp)
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
- DB 255,86,4 ; call *0x4(%esi)
- DB 131,196,108 ; add $0x6c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 139,69,12 ; mov 0xc(%ebp),%eax
+ DB 139,8 ; mov (%eax),%ecx
+ DB 15,16,1 ; movups (%ecx),%xmm0
+ DB 15,16,73,16 ; movups 0x10(%ecx),%xmm1
+ DB 15,16,81,32 ; movups 0x20(%ecx),%xmm2
+ DB 15,16,89,48 ; movups 0x30(%ecx),%xmm3
+ DB 141,72,8 ; lea 0x8(%eax),%ecx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 81 ; push %ecx
+ DB 255,117,8 ; pushl 0x8(%ebp)
+ DB 255,80,4 ; call *0x4(%eax)
+ DB 131,196,24 ; add $0x18,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -36502,39 +36394,20 @@ PUBLIC _sk_store_rgba_sse2
_sk_store_rgba_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
+ DB 131,236,8 ; sub $0x8,%esp
DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
- DB 139,85,20 ; mov 0x14(%ebp),%edx
- DB 139,117,12 ; mov 0xc(%ebp),%esi
- DB 139,62 ; mov (%esi),%edi
- DB 15,17,7 ; movups %xmm0,(%edi)
- DB 15,17,79,16 ; movups %xmm1,0x10(%edi)
- DB 15,17,87,32 ; movups %xmm2,0x20(%edi)
- DB 15,17,95,48 ; movups %xmm3,0x30(%edi)
- DB 139,125,24 ; mov 0x18(%ebp),%edi
- DB 15,40,101,40 ; movaps 0x28(%ebp),%xmm4
- DB 15,40,109,56 ; movaps 0x38(%ebp),%xmm5
- DB 15,40,117,72 ; movaps 0x48(%ebp),%xmm6
- DB 15,40,125,88 ; movaps 0x58(%ebp),%xmm7
- DB 141,94,8 ; lea 0x8(%esi),%ebx
- DB 15,41,124,36,80 ; movaps %xmm7,0x50(%esp)
- DB 15,41,116,36,64 ; movaps %xmm6,0x40(%esp)
- DB 15,41,108,36,48 ; movaps %xmm5,0x30(%esp)
- DB 15,41,100,36,32 ; movaps %xmm4,0x20(%esp)
- DB 137,124,36,16 ; mov %edi,0x10(%esp)
- DB 137,84,36,12 ; mov %edx,0xc(%esp)
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
- DB 255,86,4 ; call *0x4(%esi)
- DB 131,196,108 ; add $0x6c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 139,77,12 ; mov 0xc(%ebp),%ecx
+ DB 139,17 ; mov (%ecx),%edx
+ DB 15,17,2 ; movups %xmm0,(%edx)
+ DB 15,17,74,16 ; movups %xmm1,0x10(%edx)
+ DB 15,17,82,32 ; movups %xmm2,0x20(%edx)
+ DB 15,17,90,48 ; movups %xmm3,0x30(%edx)
+ DB 141,81,8 ; lea 0x8(%ecx),%edx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 82 ; push %edx
+ DB 80 ; push %eax
+ DB 255,81,4 ; call *0x4(%ecx)
+ DB 131,196,24 ; add $0x18,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -36542,38 +36415,18 @@ PUBLIC _sk_clear_sse2
_sk_clear_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
- DB 139,85,20 ; mov 0x14(%ebp),%edx
- DB 139,117,24 ; mov 0x18(%ebp),%esi
- DB 15,40,69,40 ; movaps 0x28(%ebp),%xmm0
- DB 15,40,77,56 ; movaps 0x38(%ebp),%xmm1
- DB 15,40,85,72 ; movaps 0x48(%ebp),%xmm2
- DB 15,40,93,88 ; movaps 0x58(%ebp),%xmm3
- DB 139,125,12 ; mov 0xc(%ebp),%edi
- DB 141,95,4 ; lea 0x4(%edi),%ebx
- DB 15,41,92,36,80 ; movaps %xmm3,0x50(%esp)
- DB 15,41,84,36,64 ; movaps %xmm2,0x40(%esp)
- DB 15,41,76,36,48 ; movaps %xmm1,0x30(%esp)
- DB 15,41,68,36,32 ; movaps %xmm0,0x20(%esp)
- DB 137,116,36,16 ; mov %esi,0x10(%esp)
- DB 137,84,36,12 ; mov %edx,0xc(%esp)
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 139,69,12 ; mov 0xc(%ebp),%eax
+ DB 141,72,4 ; lea 0x4(%eax),%ecx
+ DB 131,236,8 ; sub $0x8,%esp
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 15,87,201 ; xorps %xmm1,%xmm1
DB 15,87,210 ; xorps %xmm2,%xmm2
DB 15,87,219 ; xorps %xmm3,%xmm3
- DB 255,23 ; call *(%edi)
- DB 131,196,108 ; add $0x6c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 81 ; push %ecx
+ DB 255,117,8 ; pushl 0x8(%ebp)
+ DB 255,16 ; call *(%eax)
+ DB 131,196,24 ; add $0x18,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -36581,60 +36434,35 @@ PUBLIC _sk_srcatop_sse2
_sk_srcatop_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 15,40,234 ; movaps %xmm2,%xmm5
- DB 15,40,225 ; movaps %xmm1,%xmm4
- DB 15,40,208 ; movaps %xmm0,%xmm2
- DB 232,0,0,0,0 ; call 530 <_sk_srcatop_sse2+0x17>
- DB 88 ; pop %eax
- DB 15,40,69,88 ; movaps 0x58(%ebp),%xmm0
- DB 15,89,208 ; mulps %xmm0,%xmm2
- DB 15,40,136,208,140,0,0 ; movaps 0x8cd0(%eax),%xmm1
- DB 15,92,203 ; subps %xmm3,%xmm1
- DB 15,40,249 ; movaps %xmm1,%xmm7
- DB 15,89,125,40 ; mulps 0x28(%ebp),%xmm7
- DB 15,88,215 ; addps %xmm7,%xmm2
- DB 15,89,224 ; mulps %xmm0,%xmm4
- DB 15,40,241 ; movaps %xmm1,%xmm6
- DB 15,89,117,56 ; mulps 0x38(%ebp),%xmm6
- DB 15,88,230 ; addps %xmm6,%xmm4
- DB 15,89,232 ; mulps %xmm0,%xmm5
- DB 15,40,248 ; movaps %xmm0,%xmm7
- DB 15,40,117,72 ; movaps 0x48(%ebp),%xmm6
- DB 15,40,193 ; movaps %xmm1,%xmm0
- DB 15,89,198 ; mulps %xmm6,%xmm0
- DB 15,88,232 ; addps %xmm0,%xmm5
- DB 15,89,223 ; mulps %xmm7,%xmm3
- DB 15,89,207 ; mulps %xmm7,%xmm1
- DB 15,88,217 ; addps %xmm1,%xmm3
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
- DB 139,85,20 ; mov 0x14(%ebp),%edx
- DB 139,117,24 ; mov 0x18(%ebp),%esi
- DB 139,125,12 ; mov 0xc(%ebp),%edi
- DB 141,95,4 ; lea 0x4(%edi),%ebx
- DB 15,41,124,36,80 ; movaps %xmm7,0x50(%esp)
- DB 15,41,116,36,64 ; movaps %xmm6,0x40(%esp)
- DB 15,40,69,56 ; movaps 0x38(%ebp),%xmm0
- DB 15,41,68,36,48 ; movaps %xmm0,0x30(%esp)
- DB 15,40,69,40 ; movaps 0x28(%ebp),%xmm0
- DB 15,41,68,36,32 ; movaps %xmm0,0x20(%esp)
- DB 137,116,36,16 ; mov %esi,0x10(%esp)
- DB 137,84,36,12 ; mov %edx,0xc(%esp)
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
- DB 15,40,194 ; movaps %xmm2,%xmm0
- DB 15,40,204 ; movaps %xmm4,%xmm1
- DB 15,40,213 ; movaps %xmm5,%xmm2
- DB 255,23 ; call *(%edi)
- DB 131,196,108 ; add $0x6c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 232,0,0,0,0 ; call 34a <_sk_srcatop_sse2+0xb>
+ DB 90 ; pop %edx
+ DB 139,69,12 ; mov 0xc(%ebp),%eax
+ DB 139,77,8 ; mov 0x8(%ebp),%ecx
+ DB 15,40,97,64 ; movaps 0x40(%ecx),%xmm4
+ DB 15,89,196 ; mulps %xmm4,%xmm0
+ DB 15,40,170,214,107,0,0 ; movaps 0x6bd6(%edx),%xmm5
+ DB 15,92,235 ; subps %xmm3,%xmm5
+ DB 15,40,113,16 ; movaps 0x10(%ecx),%xmm6
+ DB 15,89,245 ; mulps %xmm5,%xmm6
+ DB 15,88,198 ; addps %xmm6,%xmm0
+ DB 15,89,204 ; mulps %xmm4,%xmm1
+ DB 15,40,113,32 ; movaps 0x20(%ecx),%xmm6
+ DB 15,89,245 ; mulps %xmm5,%xmm6
+ DB 15,88,206 ; addps %xmm6,%xmm1
+ DB 15,89,212 ; mulps %xmm4,%xmm2
+ DB 15,40,113,48 ; movaps 0x30(%ecx),%xmm6
+ DB 15,89,245 ; mulps %xmm5,%xmm6
+ DB 15,88,214 ; addps %xmm6,%xmm2
+ DB 15,89,220 ; mulps %xmm4,%xmm3
+ DB 15,89,236 ; mulps %xmm4,%xmm5
+ DB 15,88,221 ; addps %xmm5,%xmm3
+ DB 141,80,4 ; lea 0x4(%eax),%edx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 82 ; push %edx
+ DB 81 ; push %ecx
+ DB 255,16 ; call *(%eax)
+ DB 131,196,24 ; add $0x18,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -36642,54 +36470,36 @@ PUBLIC _sk_dstatop_sse2
_sk_dstatop_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 15,40,235 ; movaps %xmm3,%xmm5
- DB 232,0,0,0,0 ; call 5da <_sk_dstatop_sse2+0x11>
- DB 88 ; pop %eax
- DB 15,40,245 ; movaps %xmm5,%xmm6
- DB 15,89,117,40 ; mulps 0x28(%ebp),%xmm6
- DB 15,40,184,54,140,0,0 ; movaps 0x8c36(%eax),%xmm7
- DB 15,92,125,88 ; subps 0x58(%ebp),%xmm7
- DB 15,89,199 ; mulps %xmm7,%xmm0
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 232,0,0,0,0 ; call 3a9 <_sk_dstatop_sse2+0xb>
+ DB 90 ; pop %edx
+ DB 139,69,12 ; mov 0xc(%ebp),%eax
+ DB 139,77,8 ; mov 0x8(%ebp),%ecx
+ DB 15,40,105,64 ; movaps 0x40(%ecx),%xmm5
+ DB 15,40,113,16 ; movaps 0x10(%ecx),%xmm6
+ DB 15,89,243 ; mulps %xmm3,%xmm6
+ DB 15,40,162,135,107,0,0 ; movaps 0x6b87(%edx),%xmm4
+ DB 15,92,229 ; subps %xmm5,%xmm4
+ DB 15,89,196 ; mulps %xmm4,%xmm0
DB 15,88,198 ; addps %xmm6,%xmm0
- DB 15,40,117,56 ; movaps 0x38(%ebp),%xmm6
- DB 15,89,222 ; mulps %xmm6,%xmm3
- DB 15,89,207 ; mulps %xmm7,%xmm1
- DB 15,88,203 ; addps %xmm3,%xmm1
- DB 15,40,93,72 ; movaps 0x48(%ebp),%xmm3
- DB 15,40,229 ; movaps %xmm5,%xmm4
+ DB 15,40,113,32 ; movaps 0x20(%ecx),%xmm6
+ DB 15,89,243 ; mulps %xmm3,%xmm6
+ DB 15,89,204 ; mulps %xmm4,%xmm1
+ DB 15,88,206 ; addps %xmm6,%xmm1
+ DB 15,40,113,48 ; movaps 0x30(%ecx),%xmm6
+ DB 15,89,243 ; mulps %xmm3,%xmm6
+ DB 15,89,212 ; mulps %xmm4,%xmm2
+ DB 15,88,214 ; addps %xmm6,%xmm2
+ DB 15,89,235 ; mulps %xmm3,%xmm5
DB 15,89,227 ; mulps %xmm3,%xmm4
- DB 15,89,215 ; mulps %xmm7,%xmm2
- DB 15,88,212 ; addps %xmm4,%xmm2
- DB 15,89,253 ; mulps %xmm5,%xmm7
- DB 15,40,101,88 ; movaps 0x58(%ebp),%xmm4
- DB 15,89,236 ; mulps %xmm4,%xmm5
- DB 15,88,239 ; addps %xmm7,%xmm5
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
- DB 139,85,20 ; mov 0x14(%ebp),%edx
- DB 139,117,24 ; mov 0x18(%ebp),%esi
- DB 139,125,12 ; mov 0xc(%ebp),%edi
- DB 141,95,4 ; lea 0x4(%edi),%ebx
- DB 15,41,100,36,80 ; movaps %xmm4,0x50(%esp)
- DB 15,41,92,36,64 ; movaps %xmm3,0x40(%esp)
- DB 15,41,116,36,48 ; movaps %xmm6,0x30(%esp)
- DB 15,40,93,40 ; movaps 0x28(%ebp),%xmm3
- DB 15,41,92,36,32 ; movaps %xmm3,0x20(%esp)
- DB 137,116,36,16 ; mov %esi,0x10(%esp)
- DB 137,84,36,12 ; mov %edx,0xc(%esp)
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
- DB 15,40,221 ; movaps %xmm5,%xmm3
- DB 255,23 ; call *(%edi)
- DB 131,196,108 ; add $0x6c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 15,88,229 ; addps %xmm5,%xmm4
+ DB 141,80,4 ; lea 0x4(%eax),%edx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 15,40,220 ; movaps %xmm4,%xmm3
+ DB 82 ; push %edx
+ DB 81 ; push %ecx
+ DB 255,16 ; call *(%eax)
+ DB 131,196,24 ; add $0x18,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -36697,38 +36507,20 @@ PUBLIC _sk_srcin_sse2
_sk_srcin_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
- DB 139,85,20 ; mov 0x14(%ebp),%edx
- DB 139,117,24 ; mov 0x18(%ebp),%esi
- DB 15,40,101,40 ; movaps 0x28(%ebp),%xmm4
- DB 15,40,109,56 ; movaps 0x38(%ebp),%xmm5
- DB 15,40,117,72 ; movaps 0x48(%ebp),%xmm6
- DB 139,125,12 ; mov 0xc(%ebp),%edi
- DB 15,40,125,88 ; movaps 0x58(%ebp),%xmm7
- DB 15,89,199 ; mulps %xmm7,%xmm0
- DB 15,89,207 ; mulps %xmm7,%xmm1
- DB 15,89,215 ; mulps %xmm7,%xmm2
- DB 15,89,223 ; mulps %xmm7,%xmm3
- DB 141,95,4 ; lea 0x4(%edi),%ebx
- DB 15,41,124,36,80 ; movaps %xmm7,0x50(%esp)
- DB 15,41,116,36,64 ; movaps %xmm6,0x40(%esp)
- DB 15,41,108,36,48 ; movaps %xmm5,0x30(%esp)
- DB 15,41,100,36,32 ; movaps %xmm4,0x20(%esp)
- DB 137,116,36,16 ; mov %esi,0x10(%esp)
- DB 137,84,36,12 ; mov %edx,0xc(%esp)
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
- DB 255,23 ; call *(%edi)
- DB 131,196,108 ; add $0x6c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 139,69,12 ; mov 0xc(%ebp),%eax
+ DB 139,77,8 ; mov 0x8(%ebp),%ecx
+ DB 15,40,97,64 ; movaps 0x40(%ecx),%xmm4
+ DB 15,89,196 ; mulps %xmm4,%xmm0
+ DB 15,89,204 ; mulps %xmm4,%xmm1
+ DB 15,89,212 ; mulps %xmm4,%xmm2
+ DB 15,89,220 ; mulps %xmm4,%xmm3
+ DB 141,80,4 ; lea 0x4(%eax),%edx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 82 ; push %edx
+ DB 81 ; push %ecx
+ DB 255,16 ; call *(%eax)
+ DB 131,196,24 ; add $0x18,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -36736,41 +36528,22 @@ PUBLIC _sk_dstin_sse2
_sk_dstin_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
- DB 139,85,20 ; mov 0x14(%ebp),%edx
- DB 139,117,24 ; mov 0x18(%ebp),%esi
- DB 139,125,12 ; mov 0xc(%ebp),%edi
- DB 15,40,101,88 ; movaps 0x58(%ebp),%xmm4
- DB 15,40,109,72 ; movaps 0x48(%ebp),%xmm5
- DB 15,40,117,56 ; movaps 0x38(%ebp),%xmm6
- DB 15,40,125,40 ; movaps 0x28(%ebp),%xmm7
- DB 15,40,195 ; movaps %xmm3,%xmm0
- DB 15,89,199 ; mulps %xmm7,%xmm0
- DB 15,40,203 ; movaps %xmm3,%xmm1
- DB 15,89,206 ; mulps %xmm6,%xmm1
- DB 15,40,211 ; movaps %xmm3,%xmm2
- DB 15,89,213 ; mulps %xmm5,%xmm2
- DB 15,89,220 ; mulps %xmm4,%xmm3
- DB 141,95,4 ; lea 0x4(%edi),%ebx
- DB 15,41,100,36,80 ; movaps %xmm4,0x50(%esp)
- DB 15,41,108,36,64 ; movaps %xmm5,0x40(%esp)
- DB 15,41,116,36,48 ; movaps %xmm6,0x30(%esp)
- DB 15,41,124,36,32 ; movaps %xmm7,0x20(%esp)
- DB 137,116,36,16 ; mov %esi,0x10(%esp)
- DB 137,84,36,12 ; mov %edx,0xc(%esp)
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
- DB 255,23 ; call *(%edi)
- DB 131,196,108 ; add $0x6c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 139,69,12 ; mov 0xc(%ebp),%eax
+ DB 139,77,8 ; mov 0x8(%ebp),%ecx
+ DB 15,40,65,16 ; movaps 0x10(%ecx),%xmm0
+ DB 15,89,195 ; mulps %xmm3,%xmm0
+ DB 15,40,73,32 ; movaps 0x20(%ecx),%xmm1
+ DB 15,89,203 ; mulps %xmm3,%xmm1
+ DB 15,40,81,48 ; movaps 0x30(%ecx),%xmm2
+ DB 15,89,211 ; mulps %xmm3,%xmm2
+ DB 15,89,89,64 ; mulps 0x40(%ecx),%xmm3
+ DB 141,80,4 ; lea 0x4(%eax),%edx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 82 ; push %edx
+ DB 81 ; push %ecx
+ DB 255,16 ; call *(%eax)
+ DB 131,196,24 ; add $0x18,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -36778,42 +36551,23 @@ PUBLIC _sk_srcout_sse2
_sk_srcout_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 232,0,0,0,0 ; call 74e <_sk_srcout_sse2+0xe>
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 232,0,0,0,0 ; call 46a <_sk_srcout_sse2+0xb>
DB 88 ; pop %eax
- DB 139,77,8 ; mov 0x8(%ebp),%ecx
- DB 139,85,16 ; mov 0x10(%ebp),%edx
- DB 139,117,20 ; mov 0x14(%ebp),%esi
- DB 139,125,24 ; mov 0x18(%ebp),%edi
- DB 15,40,101,40 ; movaps 0x28(%ebp),%xmm4
- DB 15,40,109,56 ; movaps 0x38(%ebp),%xmm5
- DB 15,40,117,88 ; movaps 0x58(%ebp),%xmm6
- DB 15,40,184,210,138,0,0 ; movaps 0x8ad2(%eax),%xmm7
- DB 15,92,254 ; subps %xmm6,%xmm7
- DB 15,89,199 ; mulps %xmm7,%xmm0
- DB 15,89,207 ; mulps %xmm7,%xmm1
- DB 15,89,215 ; mulps %xmm7,%xmm2
- DB 15,89,223 ; mulps %xmm7,%xmm3
- DB 15,40,125,72 ; movaps 0x48(%ebp),%xmm7
- DB 139,69,12 ; mov 0xc(%ebp),%eax
- DB 141,88,4 ; lea 0x4(%eax),%ebx
- DB 15,41,116,36,80 ; movaps %xmm6,0x50(%esp)
- DB 15,41,124,36,64 ; movaps %xmm7,0x40(%esp)
- DB 15,41,108,36,48 ; movaps %xmm5,0x30(%esp)
- DB 15,41,100,36,32 ; movaps %xmm4,0x20(%esp)
- DB 137,124,36,16 ; mov %edi,0x10(%esp)
- DB 137,116,36,12 ; mov %esi,0xc(%esp)
- DB 137,84,36,8 ; mov %edx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,12,36 ; mov %ecx,(%esp)
- DB 255,16 ; call *(%eax)
- DB 131,196,108 ; add $0x6c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 139,77,12 ; mov 0xc(%ebp),%ecx
+ DB 139,85,8 ; mov 0x8(%ebp),%edx
+ DB 15,40,160,214,106,0,0 ; movaps 0x6ad6(%eax),%xmm4
+ DB 15,92,98,64 ; subps 0x40(%edx),%xmm4
+ DB 15,89,196 ; mulps %xmm4,%xmm0
+ DB 15,89,204 ; mulps %xmm4,%xmm1
+ DB 15,89,212 ; mulps %xmm4,%xmm2
+ DB 15,89,220 ; mulps %xmm4,%xmm3
+ DB 141,65,4 ; lea 0x4(%ecx),%eax
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 80 ; push %eax
+ DB 82 ; push %edx
+ DB 255,17 ; call *(%ecx)
+ DB 131,196,24 ; add $0x18,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -36821,47 +36575,27 @@ PUBLIC _sk_dstout_sse2
_sk_dstout_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 232,0,0,0,0 ; call 7c6 <_sk_dstout_sse2+0xe>
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 232,0,0,0,0 ; call 4a2 <_sk_dstout_sse2+0xb>
DB 88 ; pop %eax
- DB 139,77,8 ; mov 0x8(%ebp),%ecx
- DB 139,85,16 ; mov 0x10(%ebp),%edx
- DB 139,117,20 ; mov 0x14(%ebp),%esi
- DB 139,125,24 ; mov 0x18(%ebp),%edi
- DB 15,40,160,106,138,0,0 ; movaps 0x8a6a(%eax),%xmm4
- DB 139,69,12 ; mov 0xc(%ebp),%eax
- DB 15,40,109,88 ; movaps 0x58(%ebp),%xmm5
- DB 15,40,117,72 ; movaps 0x48(%ebp),%xmm6
- DB 15,40,125,56 ; movaps 0x38(%ebp),%xmm7
- DB 15,40,77,40 ; movaps 0x28(%ebp),%xmm1
+ DB 139,77,12 ; mov 0xc(%ebp),%ecx
+ DB 139,85,8 ; mov 0x8(%ebp),%edx
+ DB 15,40,160,174,106,0,0 ; movaps 0x6aae(%eax),%xmm4
DB 15,92,227 ; subps %xmm3,%xmm4
- DB 15,40,196 ; movaps %xmm4,%xmm0
- DB 15,89,193 ; mulps %xmm1,%xmm0
- DB 15,40,217 ; movaps %xmm1,%xmm3
- DB 15,40,204 ; movaps %xmm4,%xmm1
- DB 15,89,207 ; mulps %xmm7,%xmm1
- DB 15,40,212 ; movaps %xmm4,%xmm2
- DB 15,89,214 ; mulps %xmm6,%xmm2
- DB 15,89,229 ; mulps %xmm5,%xmm4
- DB 141,88,4 ; lea 0x4(%eax),%ebx
- DB 15,41,108,36,80 ; movaps %xmm5,0x50(%esp)
- DB 15,41,116,36,64 ; movaps %xmm6,0x40(%esp)
- DB 15,41,124,36,48 ; movaps %xmm7,0x30(%esp)
- DB 15,41,92,36,32 ; movaps %xmm3,0x20(%esp)
- DB 137,124,36,16 ; mov %edi,0x10(%esp)
- DB 137,116,36,12 ; mov %esi,0xc(%esp)
- DB 137,84,36,8 ; mov %edx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,12,36 ; mov %ecx,(%esp)
+ DB 15,40,66,16 ; movaps 0x10(%edx),%xmm0
+ DB 15,89,196 ; mulps %xmm4,%xmm0
+ DB 15,40,74,32 ; movaps 0x20(%edx),%xmm1
+ DB 15,89,204 ; mulps %xmm4,%xmm1
+ DB 15,40,82,48 ; movaps 0x30(%edx),%xmm2
+ DB 15,89,212 ; mulps %xmm4,%xmm2
+ DB 15,89,98,64 ; mulps 0x40(%edx),%xmm4
+ DB 141,65,4 ; lea 0x4(%ecx),%eax
+ DB 131,236,8 ; sub $0x8,%esp
DB 15,40,220 ; movaps %xmm4,%xmm3
- DB 255,16 ; call *(%eax)
- DB 131,196,108 ; add $0x6c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 80 ; push %eax
+ DB 82 ; push %edx
+ DB 255,17 ; call *(%ecx)
+ DB 131,196,24 ; add $0x18,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -36869,55 +36603,30 @@ PUBLIC _sk_srcover_sse2
_sk_srcover_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 15,40,226 ; movaps %xmm2,%xmm4
- DB 15,40,209 ; movaps %xmm1,%xmm2
- DB 15,40,200 ; movaps %xmm0,%xmm1
- DB 232,0,0,0,0 ; call 856 <_sk_srcover_sse2+0x17>
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 232,0,0,0,0 ; call 4e9 <_sk_srcover_sse2+0xb>
DB 88 ; pop %eax
- DB 15,40,109,40 ; movaps 0x28(%ebp),%xmm5
- DB 15,40,128,234,137,0,0 ; movaps 0x89ea(%eax),%xmm0
- DB 15,92,195 ; subps %xmm3,%xmm0
- DB 15,40,248 ; movaps %xmm0,%xmm7
- DB 15,89,253 ; mulps %xmm5,%xmm7
- DB 15,88,207 ; addps %xmm7,%xmm1
- DB 15,40,248 ; movaps %xmm0,%xmm7
- DB 15,89,125,56 ; mulps 0x38(%ebp),%xmm7
- DB 15,88,215 ; addps %xmm7,%xmm2
- DB 15,40,125,72 ; movaps 0x48(%ebp),%xmm7
- DB 15,40,240 ; movaps %xmm0,%xmm6
- DB 15,89,247 ; mulps %xmm7,%xmm6
- DB 15,88,230 ; addps %xmm6,%xmm4
- DB 15,40,117,88 ; movaps 0x58(%ebp),%xmm6
- DB 15,89,198 ; mulps %xmm6,%xmm0
- DB 15,88,216 ; addps %xmm0,%xmm3
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
- DB 139,85,20 ; mov 0x14(%ebp),%edx
- DB 139,117,24 ; mov 0x18(%ebp),%esi
- DB 139,125,12 ; mov 0xc(%ebp),%edi
- DB 141,95,4 ; lea 0x4(%edi),%ebx
- DB 15,41,116,36,80 ; movaps %xmm6,0x50(%esp)
- DB 15,41,124,36,64 ; movaps %xmm7,0x40(%esp)
- DB 15,40,69,56 ; movaps 0x38(%ebp),%xmm0
- DB 15,41,68,36,48 ; movaps %xmm0,0x30(%esp)
- DB 15,41,108,36,32 ; movaps %xmm5,0x20(%esp)
- DB 137,116,36,16 ; mov %esi,0x10(%esp)
- DB 137,84,36,12 ; mov %edx,0xc(%esp)
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
- DB 15,40,193 ; movaps %xmm1,%xmm0
- DB 15,40,202 ; movaps %xmm2,%xmm1
- DB 15,40,212 ; movaps %xmm4,%xmm2
- DB 255,23 ; call *(%edi)
- DB 131,196,108 ; add $0x6c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 139,77,12 ; mov 0xc(%ebp),%ecx
+ DB 139,85,8 ; mov 0x8(%ebp),%edx
+ DB 15,40,160,119,106,0,0 ; movaps 0x6a77(%eax),%xmm4
+ DB 15,92,227 ; subps %xmm3,%xmm4
+ DB 15,40,106,16 ; movaps 0x10(%edx),%xmm5
+ DB 15,89,236 ; mulps %xmm4,%xmm5
+ DB 15,88,197 ; addps %xmm5,%xmm0
+ DB 15,40,106,32 ; movaps 0x20(%edx),%xmm5
+ DB 15,89,236 ; mulps %xmm4,%xmm5
+ DB 15,88,205 ; addps %xmm5,%xmm1
+ DB 15,40,106,48 ; movaps 0x30(%edx),%xmm5
+ DB 15,89,236 ; mulps %xmm4,%xmm5
+ DB 15,88,213 ; addps %xmm5,%xmm2
+ DB 15,89,98,64 ; mulps 0x40(%edx),%xmm4
+ DB 15,88,220 ; addps %xmm4,%xmm3
+ DB 141,65,4 ; lea 0x4(%ecx),%eax
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 80 ; push %eax
+ DB 82 ; push %edx
+ DB 255,17 ; call *(%ecx)
+ DB 131,196,24 ; add $0x18,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -36925,46 +36634,29 @@ PUBLIC _sk_dstover_sse2
_sk_dstover_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 232,0,0,0,0 ; call 8ed <_sk_dstover_sse2+0xe>
- DB 90 ; pop %edx
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
- DB 139,117,20 ; mov 0x14(%ebp),%esi
- DB 139,125,24 ; mov 0x18(%ebp),%edi
- DB 15,40,162,99,137,0,0 ; movaps 0x8963(%edx),%xmm4
- DB 139,85,12 ; mov 0xc(%ebp),%edx
- DB 15,40,109,72 ; movaps 0x48(%ebp),%xmm5
- DB 15,40,117,56 ; movaps 0x38(%ebp),%xmm6
- DB 15,40,125,88 ; movaps 0x58(%ebp),%xmm7
- DB 15,92,231 ; subps %xmm7,%xmm4
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 232,0,0,0,0 ; call 539 <_sk_dstover_sse2+0xb>
+ DB 88 ; pop %eax
+ DB 139,77,12 ; mov 0xc(%ebp),%ecx
+ DB 139,85,8 ; mov 0x8(%ebp),%edx
+ DB 15,40,106,64 ; movaps 0x40(%edx),%xmm5
+ DB 15,40,160,55,106,0,0 ; movaps 0x6a37(%eax),%xmm4
+ DB 15,92,229 ; subps %xmm5,%xmm4
DB 15,89,196 ; mulps %xmm4,%xmm0
+ DB 15,88,66,16 ; addps 0x10(%edx),%xmm0
DB 15,89,204 ; mulps %xmm4,%xmm1
+ DB 15,88,74,32 ; addps 0x20(%edx),%xmm1
DB 15,89,212 ; mulps %xmm4,%xmm2
- DB 15,89,220 ; mulps %xmm4,%xmm3
- DB 15,40,101,40 ; movaps 0x28(%ebp),%xmm4
- DB 15,88,196 ; addps %xmm4,%xmm0
- DB 15,88,206 ; addps %xmm6,%xmm1
- DB 15,88,213 ; addps %xmm5,%xmm2
- DB 15,88,223 ; addps %xmm7,%xmm3
- DB 141,90,4 ; lea 0x4(%edx),%ebx
- DB 15,41,124,36,80 ; movaps %xmm7,0x50(%esp)
- DB 15,41,108,36,64 ; movaps %xmm5,0x40(%esp)
- DB 15,41,116,36,48 ; movaps %xmm6,0x30(%esp)
- DB 15,41,100,36,32 ; movaps %xmm4,0x20(%esp)
- DB 137,124,36,16 ; mov %edi,0x10(%esp)
- DB 137,116,36,12 ; mov %esi,0xc(%esp)
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
- DB 255,18 ; call *(%edx)
- DB 131,196,108 ; add $0x6c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 15,88,82,48 ; addps 0x30(%edx),%xmm2
+ DB 15,89,227 ; mulps %xmm3,%xmm4
+ DB 15,88,229 ; addps %xmm5,%xmm4
+ DB 141,65,4 ; lea 0x4(%ecx),%eax
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 15,40,220 ; movaps %xmm4,%xmm3
+ DB 80 ; push %eax
+ DB 82 ; push %edx
+ DB 255,17 ; call *(%ecx)
+ DB 131,196,24 ; add $0x18,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -36972,38 +36664,19 @@ PUBLIC _sk_modulate_sse2
_sk_modulate_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
- DB 139,85,20 ; mov 0x14(%ebp),%edx
- DB 139,117,24 ; mov 0x18(%ebp),%esi
- DB 139,125,12 ; mov 0xc(%ebp),%edi
- DB 15,40,101,88 ; movaps 0x58(%ebp),%xmm4
- DB 15,40,109,72 ; movaps 0x48(%ebp),%xmm5
- DB 15,40,117,56 ; movaps 0x38(%ebp),%xmm6
- DB 15,40,125,40 ; movaps 0x28(%ebp),%xmm7
- DB 15,89,199 ; mulps %xmm7,%xmm0
- DB 15,89,206 ; mulps %xmm6,%xmm1
- DB 15,89,213 ; mulps %xmm5,%xmm2
- DB 15,89,220 ; mulps %xmm4,%xmm3
- DB 141,95,4 ; lea 0x4(%edi),%ebx
- DB 15,41,100,36,80 ; movaps %xmm4,0x50(%esp)
- DB 15,41,108,36,64 ; movaps %xmm5,0x40(%esp)
- DB 15,41,116,36,48 ; movaps %xmm6,0x30(%esp)
- DB 15,41,124,36,32 ; movaps %xmm7,0x20(%esp)
- DB 137,116,36,16 ; mov %esi,0x10(%esp)
- DB 137,84,36,12 ; mov %edx,0xc(%esp)
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
- DB 255,23 ; call *(%edi)
- DB 131,196,108 ; add $0x6c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 139,69,12 ; mov 0xc(%ebp),%eax
+ DB 139,77,8 ; mov 0x8(%ebp),%ecx
+ DB 15,89,65,16 ; mulps 0x10(%ecx),%xmm0
+ DB 15,89,73,32 ; mulps 0x20(%ecx),%xmm1
+ DB 15,89,81,48 ; mulps 0x30(%ecx),%xmm2
+ DB 15,89,89,64 ; mulps 0x40(%ecx),%xmm3
+ DB 141,80,4 ; lea 0x4(%eax),%edx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 82 ; push %edx
+ DB 81 ; push %ecx
+ DB 255,16 ; call *(%eax)
+ DB 131,196,24 ; add $0x18,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -37011,75 +36684,59 @@ PUBLIC _sk_multiply_sse2
_sk_multiply_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 129,236,140,0,0,0 ; sub $0x8c,%esp
- DB 15,41,85,200 ; movaps %xmm2,-0x38(%ebp)
+ DB 131,236,56 ; sub $0x38,%esp
+ DB 15,41,85,216 ; movaps %xmm2,-0x28(%ebp)
DB 15,40,232 ; movaps %xmm0,%xmm5
- DB 232,0,0,0,0 ; call 9e3 <_sk_multiply_sse2+0x18>
- DB 88 ; pop %eax
- DB 15,40,144,125,136,0,0 ; movaps 0x887d(%eax),%xmm2
- DB 15,40,250 ; movaps %xmm2,%xmm7
- DB 15,92,125,88 ; subps 0x58(%ebp),%xmm7
- DB 15,40,231 ; movaps %xmm7,%xmm4
- DB 15,89,229 ; mulps %xmm5,%xmm4
- DB 15,92,211 ; subps %xmm3,%xmm2
- DB 15,40,69,40 ; movaps 0x28(%ebp),%xmm0
- DB 15,40,242 ; movaps %xmm2,%xmm6
- DB 15,89,240 ; mulps %xmm0,%xmm6
- DB 15,88,244 ; addps %xmm4,%xmm6
- DB 15,89,232 ; mulps %xmm0,%xmm5
- DB 15,88,238 ; addps %xmm6,%xmm5
- DB 15,40,247 ; movaps %xmm7,%xmm6
- DB 15,89,241 ; mulps %xmm1,%xmm6
- DB 15,40,101,56 ; movaps 0x38(%ebp),%xmm4
- DB 15,40,194 ; movaps %xmm2,%xmm0
- DB 15,89,196 ; mulps %xmm4,%xmm0
- DB 15,88,198 ; addps %xmm6,%xmm0
+ DB 232,0,0,0,0 ; call 5b8 <_sk_multiply_sse2+0x12>
+ DB 89 ; pop %ecx
+ DB 139,69,8 ; mov 0x8(%ebp),%eax
+ DB 15,40,80,64 ; movaps 0x40(%eax),%xmm2
+ DB 15,41,85,200 ; movaps %xmm2,-0x38(%ebp)
+ DB 15,40,129,200,105,0,0 ; movaps 0x69c8(%ecx),%xmm0
+ DB 15,40,240 ; movaps %xmm0,%xmm6
+ DB 15,92,242 ; subps %xmm2,%xmm6
+ DB 15,40,254 ; movaps %xmm6,%xmm7
+ DB 15,89,253 ; mulps %xmm5,%xmm7
+ DB 15,92,195 ; subps %xmm3,%xmm0
+ DB 15,40,80,16 ; movaps 0x10(%eax),%xmm2
+ DB 15,40,224 ; movaps %xmm0,%xmm4
+ DB 15,89,226 ; mulps %xmm2,%xmm4
+ DB 15,88,231 ; addps %xmm7,%xmm4
+ DB 15,89,234 ; mulps %xmm2,%xmm5
+ DB 15,88,236 ; addps %xmm4,%xmm5
+ DB 15,40,214 ; movaps %xmm6,%xmm2
+ DB 15,89,209 ; mulps %xmm1,%xmm2
+ DB 15,40,96,32 ; movaps 0x20(%eax),%xmm4
+ DB 15,40,248 ; movaps %xmm0,%xmm7
+ DB 15,89,252 ; mulps %xmm4,%xmm7
+ DB 15,88,250 ; addps %xmm2,%xmm7
DB 15,89,204 ; mulps %xmm4,%xmm1
- DB 15,88,200 ; addps %xmm0,%xmm1
- DB 15,41,77,216 ; movaps %xmm1,-0x28(%ebp)
- DB 15,40,199 ; movaps %xmm7,%xmm0
- DB 15,40,101,200 ; movaps -0x38(%ebp),%xmm4
- DB 15,89,196 ; mulps %xmm4,%xmm0
- DB 15,40,117,72 ; movaps 0x48(%ebp),%xmm6
- DB 15,40,202 ; movaps %xmm2,%xmm1
- DB 15,89,206 ; mulps %xmm6,%xmm1
- DB 15,88,200 ; addps %xmm0,%xmm1
- DB 15,89,230 ; mulps %xmm6,%xmm4
- DB 15,88,225 ; addps %xmm1,%xmm4
- DB 15,89,251 ; mulps %xmm3,%xmm7
- DB 15,40,69,88 ; movaps 0x58(%ebp),%xmm0
- DB 15,89,208 ; mulps %xmm0,%xmm2
+ DB 15,88,207 ; addps %xmm7,%xmm1
+ DB 15,41,77,232 ; movaps %xmm1,-0x18(%ebp)
+ DB 15,40,206 ; movaps %xmm6,%xmm1
+ DB 15,40,85,216 ; movaps -0x28(%ebp),%xmm2
+ DB 15,89,202 ; mulps %xmm2,%xmm1
+ DB 15,40,96,48 ; movaps 0x30(%eax),%xmm4
+ DB 15,40,248 ; movaps %xmm0,%xmm7
+ DB 15,89,252 ; mulps %xmm4,%xmm7
+ DB 15,88,249 ; addps %xmm1,%xmm7
+ DB 15,89,212 ; mulps %xmm4,%xmm2
DB 15,88,215 ; addps %xmm7,%xmm2
- DB 15,89,216 ; mulps %xmm0,%xmm3
- DB 15,88,218 ; addps %xmm2,%xmm3
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
- DB 139,85,20 ; mov 0x14(%ebp),%edx
- DB 139,117,24 ; mov 0x18(%ebp),%esi
- DB 139,125,12 ; mov 0xc(%ebp),%edi
- DB 141,95,4 ; lea 0x4(%edi),%ebx
- DB 15,41,68,36,80 ; movaps %xmm0,0x50(%esp)
- DB 15,41,116,36,64 ; movaps %xmm6,0x40(%esp)
- DB 15,40,69,56 ; movaps 0x38(%ebp),%xmm0
- DB 15,41,68,36,48 ; movaps %xmm0,0x30(%esp)
- DB 15,40,69,40 ; movaps 0x28(%ebp),%xmm0
- DB 15,41,68,36,32 ; movaps %xmm0,0x20(%esp)
- DB 137,116,36,16 ; mov %esi,0x10(%esp)
- DB 137,84,36,12 ; mov %edx,0xc(%esp)
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
+ DB 15,89,243 ; mulps %xmm3,%xmm6
+ DB 15,40,77,200 ; movaps -0x38(%ebp),%xmm1
+ DB 15,89,193 ; mulps %xmm1,%xmm0
+ DB 15,88,198 ; addps %xmm6,%xmm0
+ DB 15,89,217 ; mulps %xmm1,%xmm3
+ DB 15,88,216 ; addps %xmm0,%xmm3
+ DB 139,77,12 ; mov 0xc(%ebp),%ecx
+ DB 141,81,4 ; lea 0x4(%ecx),%edx
+ DB 131,236,8 ; sub $0x8,%esp
DB 15,40,197 ; movaps %xmm5,%xmm0
- DB 15,40,77,216 ; movaps -0x28(%ebp),%xmm1
- DB 15,40,212 ; movaps %xmm4,%xmm2
- DB 255,23 ; call *(%edi)
- DB 129,196,140,0,0,0 ; add $0x8c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 15,40,77,232 ; movaps -0x18(%ebp),%xmm1
+ DB 82 ; push %edx
+ DB 80 ; push %eax
+ DB 255,17 ; call *(%ecx)
+ DB 131,196,72 ; add $0x48,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -37087,38 +36744,19 @@ PUBLIC _sk_plus__sse2
_sk_plus__sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
- DB 139,85,20 ; mov 0x14(%ebp),%edx
- DB 139,117,24 ; mov 0x18(%ebp),%esi
- DB 139,125,12 ; mov 0xc(%ebp),%edi
- DB 15,40,101,88 ; movaps 0x58(%ebp),%xmm4
- DB 15,40,109,72 ; movaps 0x48(%ebp),%xmm5
- DB 15,40,117,56 ; movaps 0x38(%ebp),%xmm6
- DB 15,40,125,40 ; movaps 0x28(%ebp),%xmm7
- DB 15,88,199 ; addps %xmm7,%xmm0
- DB 15,88,206 ; addps %xmm6,%xmm1
- DB 15,88,213 ; addps %xmm5,%xmm2
- DB 15,88,220 ; addps %xmm4,%xmm3
- DB 141,95,4 ; lea 0x4(%edi),%ebx
- DB 15,41,100,36,80 ; movaps %xmm4,0x50(%esp)
- DB 15,41,108,36,64 ; movaps %xmm5,0x40(%esp)
- DB 15,41,116,36,48 ; movaps %xmm6,0x30(%esp)
- DB 15,41,124,36,32 ; movaps %xmm7,0x20(%esp)
- DB 137,116,36,16 ; mov %esi,0x10(%esp)
- DB 137,84,36,12 ; mov %edx,0xc(%esp)
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
- DB 255,23 ; call *(%edi)
- DB 131,196,108 ; add $0x6c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 139,69,12 ; mov 0xc(%ebp),%eax
+ DB 139,77,8 ; mov 0x8(%ebp),%ecx
+ DB 15,88,65,16 ; addps 0x10(%ecx),%xmm0
+ DB 15,88,73,32 ; addps 0x20(%ecx),%xmm1
+ DB 15,88,81,48 ; addps 0x30(%ecx),%xmm2
+ DB 15,88,89,64 ; addps 0x40(%ecx),%xmm3
+ DB 141,80,4 ; lea 0x4(%eax),%edx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 82 ; push %edx
+ DB 81 ; push %ecx
+ DB 255,16 ; call *(%eax)
+ DB 131,196,24 ; add $0x18,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -37126,55 +36764,39 @@ PUBLIC _sk_screen_sse2
_sk_screen_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 15,40,224 ; movaps %xmm0,%xmm4
- DB 15,40,125,72 ; movaps 0x48(%ebp),%xmm7
- DB 15,40,109,56 ; movaps 0x38(%ebp),%xmm5
- DB 15,40,117,40 ; movaps 0x28(%ebp),%xmm6
- DB 15,88,198 ; addps %xmm6,%xmm0
- DB 15,89,230 ; mulps %xmm6,%xmm4
- DB 15,92,196 ; subps %xmm4,%xmm0
- DB 15,40,225 ; movaps %xmm1,%xmm4
- DB 15,88,229 ; addps %xmm5,%xmm4
- DB 15,89,205 ; mulps %xmm5,%xmm1
- DB 15,92,225 ; subps %xmm1,%xmm4
- DB 15,40,234 ; movaps %xmm2,%xmm5
- DB 15,88,239 ; addps %xmm7,%xmm5
- DB 15,89,215 ; mulps %xmm7,%xmm2
- DB 15,92,234 ; subps %xmm2,%xmm5
- DB 15,40,77,88 ; movaps 0x58(%ebp),%xmm1
- DB 15,40,243 ; movaps %xmm3,%xmm6
- DB 15,88,241 ; addps %xmm1,%xmm6
- DB 15,89,217 ; mulps %xmm1,%xmm3
- DB 15,92,243 ; subps %xmm3,%xmm6
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
- DB 139,85,20 ; mov 0x14(%ebp),%edx
- DB 139,117,24 ; mov 0x18(%ebp),%esi
- DB 139,125,12 ; mov 0xc(%ebp),%edi
- DB 141,95,4 ; lea 0x4(%edi),%ebx
- DB 15,41,76,36,80 ; movaps %xmm1,0x50(%esp)
- DB 15,41,124,36,64 ; movaps %xmm7,0x40(%esp)
- DB 15,40,77,56 ; movaps 0x38(%ebp),%xmm1
- DB 15,41,76,36,48 ; movaps %xmm1,0x30(%esp)
- DB 15,40,77,40 ; movaps 0x28(%ebp),%xmm1
- DB 15,41,76,36,32 ; movaps %xmm1,0x20(%esp)
- DB 137,116,36,16 ; mov %esi,0x10(%esp)
- DB 137,84,36,12 ; mov %edx,0xc(%esp)
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
- DB 15,40,204 ; movaps %xmm4,%xmm1
- DB 15,40,213 ; movaps %xmm5,%xmm2
- DB 15,40,222 ; movaps %xmm6,%xmm3
- DB 255,23 ; call *(%edi)
- DB 131,196,108 ; add $0x6c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 139,69,12 ; mov 0xc(%ebp),%eax
+ DB 139,77,8 ; mov 0x8(%ebp),%ecx
+ DB 15,40,105,16 ; movaps 0x10(%ecx),%xmm5
+ DB 15,40,113,32 ; movaps 0x20(%ecx),%xmm6
+ DB 15,40,229 ; movaps %xmm5,%xmm4
+ DB 15,88,224 ; addps %xmm0,%xmm4
+ DB 15,89,232 ; mulps %xmm0,%xmm5
+ DB 15,92,229 ; subps %xmm5,%xmm4
+ DB 15,40,238 ; movaps %xmm6,%xmm5
+ DB 15,88,233 ; addps %xmm1,%xmm5
+ DB 15,89,241 ; mulps %xmm1,%xmm6
+ DB 15,92,238 ; subps %xmm6,%xmm5
+ DB 15,40,65,48 ; movaps 0x30(%ecx),%xmm0
+ DB 15,40,240 ; movaps %xmm0,%xmm6
+ DB 15,88,242 ; addps %xmm2,%xmm6
+ DB 15,89,194 ; mulps %xmm2,%xmm0
+ DB 15,92,240 ; subps %xmm0,%xmm6
+ DB 15,40,65,64 ; movaps 0x40(%ecx),%xmm0
+ DB 15,40,248 ; movaps %xmm0,%xmm7
+ DB 15,88,251 ; addps %xmm3,%xmm7
+ DB 15,89,195 ; mulps %xmm3,%xmm0
+ DB 15,92,248 ; subps %xmm0,%xmm7
+ DB 141,80,4 ; lea 0x4(%eax),%edx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 15,40,196 ; movaps %xmm4,%xmm0
+ DB 15,40,205 ; movaps %xmm5,%xmm1
+ DB 15,40,214 ; movaps %xmm6,%xmm2
+ DB 15,40,223 ; movaps %xmm7,%xmm3
+ DB 82 ; push %edx
+ DB 81 ; push %ecx
+ DB 255,16 ; call *(%eax)
+ DB 131,196,24 ; add $0x18,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -37182,57 +36804,38 @@ PUBLIC _sk_xor__sse2
_sk_xor__sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 131,236,124 ; sub $0x7c,%esp
- DB 15,41,93,216 ; movaps %xmm3,-0x28(%ebp)
- DB 232,0,0,0,0 ; call bca <_sk_xor__sse2+0x12>
- DB 88 ; pop %eax
- DB 15,40,176,166,134,0,0 ; movaps 0x86a6(%eax),%xmm6
- DB 15,40,254 ; movaps %xmm6,%xmm7
- DB 15,92,125,88 ; subps 0x58(%ebp),%xmm7
- DB 15,89,199 ; mulps %xmm7,%xmm0
- DB 15,92,243 ; subps %xmm3,%xmm6
- DB 15,40,222 ; movaps %xmm6,%xmm3
- DB 15,89,93,40 ; mulps 0x28(%ebp),%xmm3
- DB 15,88,195 ; addps %xmm3,%xmm0
- DB 15,89,207 ; mulps %xmm7,%xmm1
- DB 15,40,93,56 ; movaps 0x38(%ebp),%xmm3
- DB 15,40,230 ; movaps %xmm6,%xmm4
- DB 15,89,227 ; mulps %xmm3,%xmm4
- DB 15,88,204 ; addps %xmm4,%xmm1
- DB 15,89,215 ; mulps %xmm7,%xmm2
- DB 15,40,101,72 ; movaps 0x48(%ebp),%xmm4
- DB 15,40,238 ; movaps %xmm6,%xmm5
- DB 15,89,236 ; mulps %xmm4,%xmm5
- DB 15,88,213 ; addps %xmm5,%xmm2
- DB 15,89,125,216 ; mulps -0x28(%ebp),%xmm7
- DB 15,40,109,88 ; movaps 0x58(%ebp),%xmm5
- DB 15,89,245 ; mulps %xmm5,%xmm6
- DB 15,88,247 ; addps %xmm7,%xmm6
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
- DB 139,85,20 ; mov 0x14(%ebp),%edx
- DB 139,117,24 ; mov 0x18(%ebp),%esi
- DB 139,125,12 ; mov 0xc(%ebp),%edi
- DB 141,95,4 ; lea 0x4(%edi),%ebx
- DB 15,41,108,36,80 ; movaps %xmm5,0x50(%esp)
- DB 15,41,100,36,64 ; movaps %xmm4,0x40(%esp)
- DB 15,41,92,36,48 ; movaps %xmm3,0x30(%esp)
- DB 15,40,93,40 ; movaps 0x28(%ebp),%xmm3
- DB 15,41,92,36,32 ; movaps %xmm3,0x20(%esp)
- DB 137,116,36,16 ; mov %esi,0x10(%esp)
- DB 137,84,36,12 ; mov %edx,0xc(%esp)
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
- DB 15,40,222 ; movaps %xmm6,%xmm3
- DB 255,23 ; call *(%edi)
- DB 131,196,124 ; add $0x7c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 15,40,227 ; movaps %xmm3,%xmm4
+ DB 232,0,0,0,0 ; call 6f3 <_sk_xor__sse2+0xe>
+ DB 90 ; pop %edx
+ DB 139,69,12 ; mov 0xc(%ebp),%eax
+ DB 139,77,8 ; mov 0x8(%ebp),%ecx
+ DB 15,40,105,64 ; movaps 0x40(%ecx),%xmm5
+ DB 15,40,154,157,104,0,0 ; movaps 0x689d(%edx),%xmm3
+ DB 15,40,243 ; movaps %xmm3,%xmm6
+ DB 15,92,245 ; subps %xmm5,%xmm6
+ DB 15,89,198 ; mulps %xmm6,%xmm0
+ DB 15,92,220 ; subps %xmm4,%xmm3
+ DB 15,40,121,16 ; movaps 0x10(%ecx),%xmm7
+ DB 15,89,251 ; mulps %xmm3,%xmm7
+ DB 15,88,199 ; addps %xmm7,%xmm0
+ DB 15,89,206 ; mulps %xmm6,%xmm1
+ DB 15,40,121,32 ; movaps 0x20(%ecx),%xmm7
+ DB 15,89,251 ; mulps %xmm3,%xmm7
+ DB 15,88,207 ; addps %xmm7,%xmm1
+ DB 15,89,214 ; mulps %xmm6,%xmm2
+ DB 15,40,121,48 ; movaps 0x30(%ecx),%xmm7
+ DB 15,89,251 ; mulps %xmm3,%xmm7
+ DB 15,88,215 ; addps %xmm7,%xmm2
+ DB 15,89,244 ; mulps %xmm4,%xmm6
+ DB 15,89,221 ; mulps %xmm5,%xmm3
+ DB 15,88,222 ; addps %xmm6,%xmm3
+ DB 141,80,4 ; lea 0x4(%eax),%edx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 82 ; push %edx
+ DB 81 ; push %ecx
+ DB 255,16 ; call *(%eax)
+ DB 131,196,24 ; add $0x18,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -37240,67 +36843,46 @@ PUBLIC _sk_darken_sse2
_sk_darken_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 15,40,243 ; movaps %xmm3,%xmm6
- DB 15,40,225 ; movaps %xmm1,%xmm4
- DB 15,40,200 ; movaps %xmm0,%xmm1
- DB 15,40,109,88 ; movaps 0x58(%ebp),%xmm5
- DB 15,40,93,40 ; movaps 0x28(%ebp),%xmm3
- DB 15,89,205 ; mulps %xmm5,%xmm1
- DB 15,40,254 ; movaps %xmm6,%xmm7
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 15,40,224 ; movaps %xmm0,%xmm4
+ DB 232,0,0,0,0 ; call 75b <_sk_darken_sse2+0xe>
+ DB 90 ; pop %edx
+ DB 139,69,12 ; mov 0xc(%ebp),%eax
+ DB 139,77,8 ; mov 0x8(%ebp),%ecx
+ DB 15,40,113,64 ; movaps 0x40(%ecx),%xmm6
+ DB 15,40,105,16 ; movaps 0x10(%ecx),%xmm5
+ DB 15,40,121,32 ; movaps 0x20(%ecx),%xmm7
+ DB 15,40,197 ; movaps %xmm5,%xmm0
+ DB 15,88,196 ; addps %xmm4,%xmm0
+ DB 15,89,230 ; mulps %xmm6,%xmm4
+ DB 15,89,235 ; mulps %xmm3,%xmm5
+ DB 15,95,229 ; maxps %xmm5,%xmm4
+ DB 15,92,196 ; subps %xmm4,%xmm0
+ DB 15,40,231 ; movaps %xmm7,%xmm4
+ DB 15,88,225 ; addps %xmm1,%xmm4
+ DB 15,89,206 ; mulps %xmm6,%xmm1
DB 15,89,251 ; mulps %xmm3,%xmm7
DB 15,95,207 ; maxps %xmm7,%xmm1
- DB 15,40,125,56 ; movaps 0x38(%ebp),%xmm7
- DB 15,88,195 ; addps %xmm3,%xmm0
- DB 15,92,193 ; subps %xmm1,%xmm0
+ DB 15,92,225 ; subps %xmm1,%xmm4
+ DB 15,40,73,48 ; movaps 0x30(%ecx),%xmm1
+ DB 15,40,233 ; movaps %xmm1,%xmm5
+ DB 15,88,234 ; addps %xmm2,%xmm5
+ DB 15,89,214 ; mulps %xmm6,%xmm2
+ DB 15,89,203 ; mulps %xmm3,%xmm1
+ DB 15,95,209 ; maxps %xmm1,%xmm2
+ DB 15,92,234 ; subps %xmm2,%xmm5
+ DB 15,40,138,69,104,0,0 ; movaps 0x6845(%edx),%xmm1
+ DB 15,92,203 ; subps %xmm3,%xmm1
+ DB 15,89,206 ; mulps %xmm6,%xmm1
+ DB 15,88,217 ; addps %xmm1,%xmm3
+ DB 141,80,4 ; lea 0x4(%eax),%edx
+ DB 131,236,8 ; sub $0x8,%esp
DB 15,40,204 ; movaps %xmm4,%xmm1
- DB 15,89,229 ; mulps %xmm5,%xmm4
- DB 15,40,222 ; movaps %xmm6,%xmm3
- DB 15,89,223 ; mulps %xmm7,%xmm3
- DB 15,95,227 ; maxps %xmm3,%xmm4
- DB 15,88,207 ; addps %xmm7,%xmm1
- DB 15,92,204 ; subps %xmm4,%xmm1
- DB 15,40,226 ; movaps %xmm2,%xmm4
- DB 15,89,213 ; mulps %xmm5,%xmm2
- DB 15,40,93,72 ; movaps 0x48(%ebp),%xmm3
- DB 15,40,238 ; movaps %xmm6,%xmm5
- DB 15,89,235 ; mulps %xmm3,%xmm5
- DB 15,95,213 ; maxps %xmm5,%xmm2
- DB 15,88,227 ; addps %xmm3,%xmm4
- DB 15,92,226 ; subps %xmm2,%xmm4
- DB 232,0,0,0,0 ; call cc4 <_sk_darken_sse2+0x63>
- DB 88 ; pop %eax
- DB 15,40,144,188,133,0,0 ; movaps 0x85bc(%eax),%xmm2
- DB 15,92,214 ; subps %xmm6,%xmm2
- DB 15,40,109,88 ; movaps 0x58(%ebp),%xmm5
- DB 15,89,213 ; mulps %xmm5,%xmm2
- DB 15,88,242 ; addps %xmm2,%xmm6
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
- DB 139,85,20 ; mov 0x14(%ebp),%edx
- DB 139,117,24 ; mov 0x18(%ebp),%esi
- DB 139,125,12 ; mov 0xc(%ebp),%edi
- DB 141,95,4 ; lea 0x4(%edi),%ebx
- DB 15,41,108,36,80 ; movaps %xmm5,0x50(%esp)
- DB 15,41,92,36,64 ; movaps %xmm3,0x40(%esp)
- DB 15,41,124,36,48 ; movaps %xmm7,0x30(%esp)
- DB 15,40,85,40 ; movaps 0x28(%ebp),%xmm2
- DB 15,41,84,36,32 ; movaps %xmm2,0x20(%esp)
- DB 137,116,36,16 ; mov %esi,0x10(%esp)
- DB 137,84,36,12 ; mov %edx,0xc(%esp)
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
- DB 15,40,212 ; movaps %xmm4,%xmm2
- DB 15,40,222 ; movaps %xmm6,%xmm3
- DB 255,23 ; call *(%edi)
- DB 131,196,108 ; add $0x6c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 15,40,213 ; movaps %xmm5,%xmm2
+ DB 82 ; push %edx
+ DB 81 ; push %ecx
+ DB 255,16 ; call *(%eax)
+ DB 131,196,24 ; add $0x18,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -37308,67 +36890,46 @@ PUBLIC _sk_lighten_sse2
_sk_lighten_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 15,40,243 ; movaps %xmm3,%xmm6
- DB 15,40,225 ; movaps %xmm1,%xmm4
- DB 15,40,200 ; movaps %xmm0,%xmm1
- DB 15,40,109,88 ; movaps 0x58(%ebp),%xmm5
- DB 15,40,93,40 ; movaps 0x28(%ebp),%xmm3
- DB 15,89,205 ; mulps %xmm5,%xmm1
- DB 15,40,254 ; movaps %xmm6,%xmm7
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 15,40,224 ; movaps %xmm0,%xmm4
+ DB 232,0,0,0,0 ; call 7db <_sk_lighten_sse2+0xe>
+ DB 90 ; pop %edx
+ DB 139,69,12 ; mov 0xc(%ebp),%eax
+ DB 139,77,8 ; mov 0x8(%ebp),%ecx
+ DB 15,40,113,64 ; movaps 0x40(%ecx),%xmm6
+ DB 15,40,105,16 ; movaps 0x10(%ecx),%xmm5
+ DB 15,40,121,32 ; movaps 0x20(%ecx),%xmm7
+ DB 15,40,197 ; movaps %xmm5,%xmm0
+ DB 15,88,196 ; addps %xmm4,%xmm0
+ DB 15,89,230 ; mulps %xmm6,%xmm4
+ DB 15,89,235 ; mulps %xmm3,%xmm5
+ DB 15,93,229 ; minps %xmm5,%xmm4
+ DB 15,92,196 ; subps %xmm4,%xmm0
+ DB 15,40,231 ; movaps %xmm7,%xmm4
+ DB 15,88,225 ; addps %xmm1,%xmm4
+ DB 15,89,206 ; mulps %xmm6,%xmm1
DB 15,89,251 ; mulps %xmm3,%xmm7
DB 15,93,207 ; minps %xmm7,%xmm1
- DB 15,40,125,56 ; movaps 0x38(%ebp),%xmm7
- DB 15,88,195 ; addps %xmm3,%xmm0
- DB 15,92,193 ; subps %xmm1,%xmm0
+ DB 15,92,225 ; subps %xmm1,%xmm4
+ DB 15,40,73,48 ; movaps 0x30(%ecx),%xmm1
+ DB 15,40,233 ; movaps %xmm1,%xmm5
+ DB 15,88,234 ; addps %xmm2,%xmm5
+ DB 15,89,214 ; mulps %xmm6,%xmm2
+ DB 15,89,203 ; mulps %xmm3,%xmm1
+ DB 15,93,209 ; minps %xmm1,%xmm2
+ DB 15,92,234 ; subps %xmm2,%xmm5
+ DB 15,40,138,213,103,0,0 ; movaps 0x67d5(%edx),%xmm1
+ DB 15,92,203 ; subps %xmm3,%xmm1
+ DB 15,89,206 ; mulps %xmm6,%xmm1
+ DB 15,88,217 ; addps %xmm1,%xmm3
+ DB 141,80,4 ; lea 0x4(%eax),%edx
+ DB 131,236,8 ; sub $0x8,%esp
DB 15,40,204 ; movaps %xmm4,%xmm1
- DB 15,89,229 ; mulps %xmm5,%xmm4
- DB 15,40,222 ; movaps %xmm6,%xmm3
- DB 15,89,223 ; mulps %xmm7,%xmm3
- DB 15,93,227 ; minps %xmm3,%xmm4
- DB 15,88,207 ; addps %xmm7,%xmm1
- DB 15,92,204 ; subps %xmm4,%xmm1
- DB 15,40,226 ; movaps %xmm2,%xmm4
- DB 15,89,213 ; mulps %xmm5,%xmm2
- DB 15,40,93,72 ; movaps 0x48(%ebp),%xmm3
- DB 15,40,238 ; movaps %xmm6,%xmm5
- DB 15,89,235 ; mulps %xmm3,%xmm5
- DB 15,93,213 ; minps %xmm5,%xmm2
- DB 15,88,227 ; addps %xmm3,%xmm4
- DB 15,92,226 ; subps %xmm2,%xmm4
- DB 232,0,0,0,0 ; call d89 <_sk_lighten_sse2+0x63>
- DB 88 ; pop %eax
- DB 15,40,144,7,133,0,0 ; movaps 0x8507(%eax),%xmm2
- DB 15,92,214 ; subps %xmm6,%xmm2
- DB 15,40,109,88 ; movaps 0x58(%ebp),%xmm5
- DB 15,89,213 ; mulps %xmm5,%xmm2
- DB 15,88,242 ; addps %xmm2,%xmm6
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
- DB 139,85,20 ; mov 0x14(%ebp),%edx
- DB 139,117,24 ; mov 0x18(%ebp),%esi
- DB 139,125,12 ; mov 0xc(%ebp),%edi
- DB 141,95,4 ; lea 0x4(%edi),%ebx
- DB 15,41,108,36,80 ; movaps %xmm5,0x50(%esp)
- DB 15,41,92,36,64 ; movaps %xmm3,0x40(%esp)
- DB 15,41,124,36,48 ; movaps %xmm7,0x30(%esp)
- DB 15,40,85,40 ; movaps 0x28(%ebp),%xmm2
- DB 15,41,84,36,32 ; movaps %xmm2,0x20(%esp)
- DB 137,116,36,16 ; mov %esi,0x10(%esp)
- DB 137,84,36,12 ; mov %edx,0xc(%esp)
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
- DB 15,40,212 ; movaps %xmm4,%xmm2
- DB 15,40,222 ; movaps %xmm6,%xmm3
- DB 255,23 ; call *(%edi)
- DB 131,196,108 ; add $0x6c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 15,40,213 ; movaps %xmm5,%xmm2
+ DB 82 ; push %edx
+ DB 81 ; push %ecx
+ DB 255,16 ; call *(%eax)
+ DB 131,196,24 ; add $0x18,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -37376,70 +36937,49 @@ PUBLIC _sk_difference_sse2
_sk_difference_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 15,40,243 ; movaps %xmm3,%xmm6
+ DB 131,236,8 ; sub $0x8,%esp
DB 15,40,225 ; movaps %xmm1,%xmm4
DB 15,40,200 ; movaps %xmm0,%xmm1
- DB 15,40,109,88 ; movaps 0x58(%ebp),%xmm5
- DB 15,40,93,40 ; movaps 0x28(%ebp),%xmm3
+ DB 232,0,0,0,0 ; call 85e <_sk_difference_sse2+0x11>
+ DB 90 ; pop %edx
+ DB 139,69,12 ; mov 0xc(%ebp),%eax
+ DB 139,77,8 ; mov 0x8(%ebp),%ecx
+ DB 15,40,105,64 ; movaps 0x40(%ecx),%xmm5
+ DB 15,40,113,16 ; movaps 0x10(%ecx),%xmm6
+ DB 15,40,121,32 ; movaps 0x20(%ecx),%xmm7
+ DB 15,40,198 ; movaps %xmm6,%xmm0
+ DB 15,88,193 ; addps %xmm1,%xmm0
DB 15,89,205 ; mulps %xmm5,%xmm1
- DB 15,40,254 ; movaps %xmm6,%xmm7
- DB 15,89,251 ; mulps %xmm3,%xmm7
- DB 15,93,207 ; minps %xmm7,%xmm1
- DB 15,40,125,56 ; movaps 0x38(%ebp),%xmm7
- DB 15,88,195 ; addps %xmm3,%xmm0
+ DB 15,89,243 ; mulps %xmm3,%xmm6
+ DB 15,93,206 ; minps %xmm6,%xmm1
DB 15,88,201 ; addps %xmm1,%xmm1
DB 15,92,193 ; subps %xmm1,%xmm0
- DB 15,40,204 ; movaps %xmm4,%xmm1
+ DB 15,40,207 ; movaps %xmm7,%xmm1
+ DB 15,88,204 ; addps %xmm4,%xmm1
DB 15,89,229 ; mulps %xmm5,%xmm4
- DB 15,40,222 ; movaps %xmm6,%xmm3
- DB 15,89,223 ; mulps %xmm7,%xmm3
- DB 15,93,227 ; minps %xmm3,%xmm4
- DB 15,88,207 ; addps %xmm7,%xmm1
+ DB 15,89,251 ; mulps %xmm3,%xmm7
+ DB 15,93,231 ; minps %xmm7,%xmm4
DB 15,88,228 ; addps %xmm4,%xmm4
DB 15,92,204 ; subps %xmm4,%xmm1
- DB 15,40,226 ; movaps %xmm2,%xmm4
+ DB 15,40,113,48 ; movaps 0x30(%ecx),%xmm6
+ DB 15,40,230 ; movaps %xmm6,%xmm4
+ DB 15,88,226 ; addps %xmm2,%xmm4
DB 15,89,213 ; mulps %xmm5,%xmm2
- DB 15,40,93,72 ; movaps 0x48(%ebp),%xmm3
- DB 15,40,238 ; movaps %xmm6,%xmm5
- DB 15,89,235 ; mulps %xmm3,%xmm5
- DB 15,93,213 ; minps %xmm5,%xmm2
- DB 15,88,227 ; addps %xmm3,%xmm4
+ DB 15,89,243 ; mulps %xmm3,%xmm6
+ DB 15,93,214 ; minps %xmm6,%xmm2
DB 15,88,210 ; addps %xmm2,%xmm2
DB 15,92,226 ; subps %xmm2,%xmm4
- DB 232,0,0,0,0 ; call e57 <_sk_difference_sse2+0x6c>
- DB 88 ; pop %eax
- DB 15,40,144,73,132,0,0 ; movaps 0x8449(%eax),%xmm2
- DB 15,92,214 ; subps %xmm6,%xmm2
- DB 15,40,109,88 ; movaps 0x58(%ebp),%xmm5
+ DB 15,40,146,98,103,0,0 ; movaps 0x6762(%edx),%xmm2
+ DB 15,92,211 ; subps %xmm3,%xmm2
DB 15,89,213 ; mulps %xmm5,%xmm2
- DB 15,88,242 ; addps %xmm2,%xmm6
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
- DB 139,85,20 ; mov 0x14(%ebp),%edx
- DB 139,117,24 ; mov 0x18(%ebp),%esi
- DB 139,125,12 ; mov 0xc(%ebp),%edi
- DB 141,95,4 ; lea 0x4(%edi),%ebx
- DB 15,41,108,36,80 ; movaps %xmm5,0x50(%esp)
- DB 15,41,92,36,64 ; movaps %xmm3,0x40(%esp)
- DB 15,41,124,36,48 ; movaps %xmm7,0x30(%esp)
- DB 15,40,85,40 ; movaps 0x28(%ebp),%xmm2
- DB 15,41,84,36,32 ; movaps %xmm2,0x20(%esp)
- DB 137,116,36,16 ; mov %esi,0x10(%esp)
- DB 137,84,36,12 ; mov %edx,0xc(%esp)
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
+ DB 15,88,218 ; addps %xmm2,%xmm3
+ DB 141,80,4 ; lea 0x4(%eax),%edx
+ DB 131,236,8 ; sub $0x8,%esp
DB 15,40,212 ; movaps %xmm4,%xmm2
- DB 15,40,222 ; movaps %xmm6,%xmm3
- DB 255,23 ; call *(%edi)
- DB 131,196,108 ; add $0x6c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 82 ; push %edx
+ DB 81 ; push %ecx
+ DB 255,16 ; call *(%eax)
+ DB 131,196,24 ; add $0x18,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -37447,58 +36987,42 @@ PUBLIC _sk_exclusion_sse2
_sk_exclusion_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 15,40,225 ; movaps %xmm1,%xmm4
- DB 15,40,200 ; movaps %xmm0,%xmm1
- DB 232,0,0,0,0 ; call ecd <_sk_exclusion_sse2+0x14>
- DB 88 ; pop %eax
- DB 15,40,109,72 ; movaps 0x48(%ebp),%xmm5
- DB 15,40,117,56 ; movaps 0x38(%ebp),%xmm6
- DB 15,40,125,40 ; movaps 0x28(%ebp),%xmm7
- DB 15,88,199 ; addps %xmm7,%xmm0
- DB 15,89,207 ; mulps %xmm7,%xmm1
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 15,40,224 ; movaps %xmm0,%xmm4
+ DB 232,0,0,0,0 ; call 8e4 <_sk_exclusion_sse2+0xe>
+ DB 90 ; pop %edx
+ DB 139,69,12 ; mov 0xc(%ebp),%eax
+ DB 139,77,8 ; mov 0x8(%ebp),%ecx
+ DB 15,40,105,16 ; movaps 0x10(%ecx),%xmm5
+ DB 15,40,113,32 ; movaps 0x20(%ecx),%xmm6
+ DB 15,40,197 ; movaps %xmm5,%xmm0
+ DB 15,88,196 ; addps %xmm4,%xmm0
+ DB 15,89,236 ; mulps %xmm4,%xmm5
+ DB 15,88,237 ; addps %xmm5,%xmm5
+ DB 15,92,197 ; subps %xmm5,%xmm0
+ DB 15,40,230 ; movaps %xmm6,%xmm4
+ DB 15,88,225 ; addps %xmm1,%xmm4
+ DB 15,89,241 ; mulps %xmm1,%xmm6
+ DB 15,88,246 ; addps %xmm6,%xmm6
+ DB 15,92,230 ; subps %xmm6,%xmm4
+ DB 15,40,73,48 ; movaps 0x30(%ecx),%xmm1
+ DB 15,40,233 ; movaps %xmm1,%xmm5
+ DB 15,88,234 ; addps %xmm2,%xmm5
+ DB 15,89,202 ; mulps %xmm2,%xmm1
DB 15,88,201 ; addps %xmm1,%xmm1
- DB 15,92,193 ; subps %xmm1,%xmm0
+ DB 15,92,233 ; subps %xmm1,%xmm5
+ DB 15,40,138,236,102,0,0 ; movaps 0x66ec(%edx),%xmm1
+ DB 15,92,203 ; subps %xmm3,%xmm1
+ DB 15,89,73,64 ; mulps 0x40(%ecx),%xmm1
+ DB 15,88,217 ; addps %xmm1,%xmm3
+ DB 141,80,4 ; lea 0x4(%eax),%edx
+ DB 131,236,8 ; sub $0x8,%esp
DB 15,40,204 ; movaps %xmm4,%xmm1
- DB 15,88,206 ; addps %xmm6,%xmm1
- DB 15,89,230 ; mulps %xmm6,%xmm4
- DB 15,88,228 ; addps %xmm4,%xmm4
- DB 15,92,204 ; subps %xmm4,%xmm1
- DB 15,40,226 ; movaps %xmm2,%xmm4
- DB 15,88,229 ; addps %xmm5,%xmm4
- DB 15,89,213 ; mulps %xmm5,%xmm2
- DB 15,88,210 ; addps %xmm2,%xmm2
- DB 15,92,226 ; subps %xmm2,%xmm4
- DB 15,40,144,227,131,0,0 ; movaps 0x83e3(%eax),%xmm2
- DB 15,92,211 ; subps %xmm3,%xmm2
- DB 15,40,109,88 ; movaps 0x58(%ebp),%xmm5
- DB 15,89,213 ; mulps %xmm5,%xmm2
- DB 15,88,218 ; addps %xmm2,%xmm3
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
- DB 139,85,20 ; mov 0x14(%ebp),%edx
- DB 139,117,24 ; mov 0x18(%ebp),%esi
- DB 139,125,12 ; mov 0xc(%ebp),%edi
- DB 141,95,4 ; lea 0x4(%edi),%ebx
- DB 15,41,108,36,80 ; movaps %xmm5,0x50(%esp)
- DB 15,40,85,72 ; movaps 0x48(%ebp),%xmm2
- DB 15,41,84,36,64 ; movaps %xmm2,0x40(%esp)
- DB 15,41,116,36,48 ; movaps %xmm6,0x30(%esp)
- DB 15,41,124,36,32 ; movaps %xmm7,0x20(%esp)
- DB 137,116,36,16 ; mov %esi,0x10(%esp)
- DB 137,84,36,12 ; mov %edx,0xc(%esp)
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
- DB 15,40,212 ; movaps %xmm4,%xmm2
- DB 255,23 ; call *(%edi)
- DB 131,196,108 ; add $0x6c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 15,40,213 ; movaps %xmm5,%xmm2
+ DB 82 ; push %edx
+ DB 81 ; push %ecx
+ DB 255,16 ; call *(%eax)
+ DB 131,196,24 ; add $0x18,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -37506,141 +37030,131 @@ PUBLIC _sk_colorburn_sse2
_sk_colorburn_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 129,236,172,0,0,0 ; sub $0xac,%esp
- DB 15,41,85,168 ; movaps %xmm2,-0x58(%ebp)
- DB 15,41,77,200 ; movaps %xmm1,-0x38(%ebp)
- DB 15,40,200 ; movaps %xmm0,%xmm1
- DB 232,0,0,0,0 ; call f7e <_sk_colorburn_sse2+0x1c>
- DB 88 ; pop %eax
- DB 15,40,101,88 ; movaps 0x58(%ebp),%xmm4
- DB 15,40,196 ; movaps %xmm4,%xmm0
- DB 15,92,69,40 ; subps 0x28(%ebp),%xmm0
- DB 15,40,211 ; movaps %xmm3,%xmm2
- DB 15,89,194 ; mulps %xmm2,%xmm0
- DB 15,94,193 ; divps %xmm1,%xmm0
- DB 15,40,244 ; movaps %xmm4,%xmm6
- DB 15,93,240 ; minps %xmm0,%xmm6
- DB 15,40,196 ; movaps %xmm4,%xmm0
+ DB 131,236,120 ; sub $0x78,%esp
+ DB 15,40,235 ; movaps %xmm3,%xmm5
+ DB 15,41,109,200 ; movaps %xmm5,-0x38(%ebp)
+ DB 15,41,85,136 ; movaps %xmm2,-0x78(%ebp)
+ DB 15,41,77,168 ; movaps %xmm1,-0x58(%ebp)
+ DB 15,40,216 ; movaps %xmm0,%xmm3
+ DB 232,0,0,0,0 ; call 967 <_sk_colorburn_sse2+0x1d>
+ DB 89 ; pop %ecx
+ DB 139,69,8 ; mov 0x8(%ebp),%eax
+ DB 15,40,64,64 ; movaps 0x40(%eax),%xmm0
+ DB 15,40,96,16 ; movaps 0x10(%eax),%xmm4
+ DB 15,40,208 ; movaps %xmm0,%xmm2
+ DB 15,92,212 ; subps %xmm4,%xmm2
+ DB 15,89,213 ; mulps %xmm5,%xmm2
+ DB 15,94,211 ; divps %xmm3,%xmm2
+ DB 15,40,240 ; movaps %xmm0,%xmm6
+ DB 15,93,242 ; minps %xmm2,%xmm6
+ DB 15,41,69,184 ; movaps %xmm0,-0x48(%ebp)
DB 15,40,232 ; movaps %xmm0,%xmm5
DB 15,92,238 ; subps %xmm6,%xmm5
- DB 15,40,176,66,131,0,0 ; movaps 0x8342(%eax),%xmm6
- DB 15,40,230 ; movaps %xmm6,%xmm4
- DB 15,92,224 ; subps %xmm0,%xmm4
- DB 15,40,220 ; movaps %xmm4,%xmm3
- DB 15,41,101,216 ; movaps %xmm4,-0x28(%ebp)
- DB 15,89,217 ; mulps %xmm1,%xmm3
- DB 15,87,255 ; xorps %xmm7,%xmm7
- DB 15,40,193 ; movaps %xmm1,%xmm0
- DB 15,194,199,0 ; cmpeqps %xmm7,%xmm0
- DB 15,89,234 ; mulps %xmm2,%xmm5
- DB 15,88,235 ; addps %xmm3,%xmm5
- DB 15,84,200 ; andps %xmm0,%xmm1
- DB 15,85,197 ; andnps %xmm5,%xmm0
- DB 15,86,193 ; orps %xmm1,%xmm0
- DB 15,92,242 ; subps %xmm2,%xmm6
- DB 15,40,234 ; movaps %xmm2,%xmm5
+ DB 15,40,177,121,102,0,0 ; movaps 0x6679(%ecx),%xmm6
DB 15,40,206 ; movaps %xmm6,%xmm1
- DB 15,40,85,40 ; movaps 0x28(%ebp),%xmm2
- DB 15,89,202 ; mulps %xmm2,%xmm1
- DB 15,88,193 ; addps %xmm1,%xmm0
- DB 15,40,202 ; movaps %xmm2,%xmm1
- DB 15,194,77,88,0 ; cmpeqps 0x58(%ebp),%xmm1
- DB 15,88,218 ; addps %xmm2,%xmm3
- DB 15,84,217 ; andps %xmm1,%xmm3
- DB 15,85,200 ; andnps %xmm0,%xmm1
- DB 15,86,203 ; orps %xmm3,%xmm1
- DB 15,41,77,184 ; movaps %xmm1,-0x48(%ebp)
- DB 15,40,93,88 ; movaps 0x58(%ebp),%xmm3
- DB 15,40,195 ; movaps %xmm3,%xmm0
- DB 15,92,69,56 ; subps 0x38(%ebp),%xmm0
- DB 15,89,197 ; mulps %xmm5,%xmm0
+ DB 15,92,200 ; subps %xmm0,%xmm1
+ DB 15,41,77,216 ; movaps %xmm1,-0x28(%ebp)
+ DB 15,40,249 ; movaps %xmm1,%xmm7
+ DB 15,89,251 ; mulps %xmm3,%xmm7
+ DB 15,40,196 ; movaps %xmm4,%xmm0
+ DB 15,88,231 ; addps %xmm7,%xmm4
DB 15,40,85,200 ; movaps -0x38(%ebp),%xmm2
- DB 15,94,194 ; divps %xmm2,%xmm0
+ DB 15,89,234 ; mulps %xmm2,%xmm5
+ DB 15,88,239 ; addps %xmm7,%xmm5
+ DB 15,87,255 ; xorps %xmm7,%xmm7
DB 15,40,203 ; movaps %xmm3,%xmm1
- DB 15,93,200 ; minps %xmm0,%xmm1
- DB 15,40,195 ; movaps %xmm3,%xmm0
- DB 15,92,193 ; subps %xmm1,%xmm0
- DB 15,40,220 ; movaps %xmm4,%xmm3
- DB 15,40,202 ; movaps %xmm2,%xmm1
- DB 15,89,217 ; mulps %xmm1,%xmm3
- DB 15,194,215,0 ; cmpeqps %xmm7,%xmm2
- DB 15,89,197 ; mulps %xmm5,%xmm0
- DB 15,40,229 ; movaps %xmm5,%xmm4
- DB 15,88,195 ; addps %xmm3,%xmm0
- DB 15,84,202 ; andps %xmm2,%xmm1
- DB 15,85,208 ; andnps %xmm0,%xmm2
- DB 15,86,209 ; orps %xmm1,%xmm2
- DB 15,40,198 ; movaps %xmm6,%xmm0
- DB 15,40,77,56 ; movaps 0x38(%ebp),%xmm1
- DB 15,89,193 ; mulps %xmm1,%xmm0
- DB 15,88,208 ; addps %xmm0,%xmm2
- DB 15,40,193 ; movaps %xmm1,%xmm0
- DB 15,40,232 ; movaps %xmm0,%xmm5
- DB 15,40,77,88 ; movaps 0x58(%ebp),%xmm1
- DB 15,194,233,0 ; cmpeqps %xmm1,%xmm5
- DB 15,88,216 ; addps %xmm0,%xmm3
- DB 15,84,221 ; andps %xmm5,%xmm3
- DB 15,85,234 ; andnps %xmm2,%xmm5
- DB 15,86,235 ; orps %xmm3,%xmm5
- DB 15,40,193 ; movaps %xmm1,%xmm0
- DB 15,92,69,72 ; subps 0x48(%ebp),%xmm0
- DB 15,89,196 ; mulps %xmm4,%xmm0
- DB 15,40,93,168 ; movaps -0x58(%ebp),%xmm3
- DB 15,94,195 ; divps %xmm3,%xmm0
- DB 15,40,209 ; movaps %xmm1,%xmm2
- DB 15,93,208 ; minps %xmm0,%xmm2
- DB 15,40,193 ; movaps %xmm1,%xmm0
- DB 15,92,194 ; subps %xmm2,%xmm0
+ DB 15,194,207,0 ; cmpeqps %xmm7,%xmm1
+ DB 15,84,217 ; andps %xmm1,%xmm3
+ DB 15,85,205 ; andnps %xmm5,%xmm1
+ DB 15,86,203 ; orps %xmm3,%xmm1
+ DB 15,92,242 ; subps %xmm2,%xmm6
+ DB 15,41,117,232 ; movaps %xmm6,-0x18(%ebp)
+ DB 15,40,234 ; movaps %xmm2,%xmm5
+ DB 15,40,222 ; movaps %xmm6,%xmm3
+ DB 15,89,216 ; mulps %xmm0,%xmm3
+ DB 15,88,203 ; addps %xmm3,%xmm1
+ DB 15,40,208 ; movaps %xmm0,%xmm2
+ DB 15,40,93,184 ; movaps -0x48(%ebp),%xmm3
+ DB 15,194,211,0 ; cmpeqps %xmm3,%xmm2
+ DB 15,84,226 ; andps %xmm2,%xmm4
+ DB 15,85,209 ; andnps %xmm1,%xmm2
+ DB 15,86,212 ; orps %xmm4,%xmm2
+ DB 15,41,85,152 ; movaps %xmm2,-0x68(%ebp)
+ DB 15,40,64,32 ; movaps 0x20(%eax),%xmm0
DB 15,40,211 ; movaps %xmm3,%xmm2
- DB 15,40,77,216 ; movaps -0x28(%ebp),%xmm1
- DB 15,89,202 ; mulps %xmm2,%xmm1
+ DB 15,92,216 ; subps %xmm0,%xmm3
+ DB 15,89,221 ; mulps %xmm5,%xmm3
+ DB 15,40,77,168 ; movaps -0x58(%ebp),%xmm1
+ DB 15,94,217 ; divps %xmm1,%xmm3
+ DB 15,40,226 ; movaps %xmm2,%xmm4
+ DB 15,93,227 ; minps %xmm3,%xmm4
+ DB 15,40,218 ; movaps %xmm2,%xmm3
+ DB 15,92,220 ; subps %xmm4,%xmm3
+ DB 15,40,101,216 ; movaps -0x28(%ebp),%xmm4
+ DB 15,89,225 ; mulps %xmm1,%xmm4
+ DB 15,40,240 ; movaps %xmm0,%xmm6
+ DB 15,88,244 ; addps %xmm4,%xmm6
+ DB 15,89,221 ; mulps %xmm5,%xmm3
+ DB 15,88,220 ; addps %xmm4,%xmm3
+ DB 15,40,225 ; movaps %xmm1,%xmm4
+ DB 15,87,255 ; xorps %xmm7,%xmm7
+ DB 15,194,231,0 ; cmpeqps %xmm7,%xmm4
+ DB 15,84,204 ; andps %xmm4,%xmm1
+ DB 15,85,227 ; andnps %xmm3,%xmm4
+ DB 15,86,225 ; orps %xmm1,%xmm4
+ DB 15,40,93,232 ; movaps -0x18(%ebp),%xmm3
+ DB 15,89,216 ; mulps %xmm0,%xmm3
+ DB 15,88,227 ; addps %xmm3,%xmm4
+ DB 15,40,248 ; movaps %xmm0,%xmm7
DB 15,194,250,0 ; cmpeqps %xmm2,%xmm7
- DB 15,40,220 ; movaps %xmm4,%xmm3
- DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,193 ; addps %xmm1,%xmm0
- DB 15,84,215 ; andps %xmm7,%xmm2
- DB 15,85,248 ; andnps %xmm0,%xmm7
- DB 15,86,250 ; orps %xmm2,%xmm7
- DB 15,40,198 ; movaps %xmm6,%xmm0
- DB 15,40,85,72 ; movaps 0x48(%ebp),%xmm2
+ DB 15,84,247 ; andps %xmm7,%xmm6
+ DB 15,85,252 ; andnps %xmm4,%xmm7
+ DB 15,86,254 ; orps %xmm6,%xmm7
+ DB 15,40,96,48 ; movaps 0x30(%eax),%xmm4
+ DB 15,40,202 ; movaps %xmm2,%xmm1
+ DB 15,92,204 ; subps %xmm4,%xmm1
+ DB 15,89,205 ; mulps %xmm5,%xmm1
+ DB 15,40,109,136 ; movaps -0x78(%ebp),%xmm5
+ DB 15,94,205 ; divps %xmm5,%xmm1
+ DB 15,40,218 ; movaps %xmm2,%xmm3
+ DB 15,93,217 ; minps %xmm1,%xmm3
+ DB 15,40,69,216 ; movaps -0x28(%ebp),%xmm0
+ DB 15,89,197 ; mulps %xmm5,%xmm0
+ DB 15,41,69,216 ; movaps %xmm0,-0x28(%ebp)
+ DB 15,40,200 ; movaps %xmm0,%xmm1
+ DB 15,88,204 ; addps %xmm4,%xmm1
+ DB 15,40,69,232 ; movaps -0x18(%ebp),%xmm0
+ DB 15,40,240 ; movaps %xmm0,%xmm6
+ DB 15,89,244 ; mulps %xmm4,%xmm6
+ DB 15,194,226,0 ; cmpeqps %xmm2,%xmm4
DB 15,89,194 ; mulps %xmm2,%xmm0
- DB 15,88,248 ; addps %xmm0,%xmm7
- DB 15,40,194 ; movaps %xmm2,%xmm0
- DB 15,194,85,88,0 ; cmpeqps 0x58(%ebp),%xmm2
- DB 15,88,200 ; addps %xmm0,%xmm1
- DB 15,84,202 ; andps %xmm2,%xmm1
- DB 15,85,215 ; andnps %xmm7,%xmm2
- DB 15,86,209 ; orps %xmm1,%xmm2
- DB 15,40,77,88 ; movaps 0x58(%ebp),%xmm1
- DB 15,89,241 ; mulps %xmm1,%xmm6
- DB 15,88,222 ; addps %xmm6,%xmm3
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
- DB 139,85,20 ; mov 0x14(%ebp),%edx
- DB 139,117,24 ; mov 0x18(%ebp),%esi
- DB 139,125,12 ; mov 0xc(%ebp),%edi
- DB 141,95,4 ; lea 0x4(%edi),%ebx
- DB 15,41,76,36,80 ; movaps %xmm1,0x50(%esp)
- DB 15,41,68,36,64 ; movaps %xmm0,0x40(%esp)
- DB 15,40,69,56 ; movaps 0x38(%ebp),%xmm0
- DB 15,41,68,36,48 ; movaps %xmm0,0x30(%esp)
- DB 15,40,69,40 ; movaps 0x28(%ebp),%xmm0
- DB 15,41,68,36,32 ; movaps %xmm0,0x20(%esp)
- DB 137,116,36,16 ; mov %esi,0x10(%esp)
- DB 137,84,36,12 ; mov %edx,0xc(%esp)
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
- DB 15,40,69,184 ; movaps -0x48(%ebp),%xmm0
- DB 15,40,205 ; movaps %xmm5,%xmm1
- DB 255,23 ; call *(%edi)
- DB 129,196,172,0,0,0 ; add $0xac,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 15,41,69,232 ; movaps %xmm0,-0x18(%ebp)
+ DB 15,92,211 ; subps %xmm3,%xmm2
+ DB 15,40,93,200 ; movaps -0x38(%ebp),%xmm3
+ DB 15,89,211 ; mulps %xmm3,%xmm2
+ DB 15,88,85,216 ; addps -0x28(%ebp),%xmm2
+ DB 15,87,192 ; xorps %xmm0,%xmm0
+ DB 15,194,197,0 ; cmpeqps %xmm5,%xmm0
+ DB 15,84,232 ; andps %xmm0,%xmm5
+ DB 15,85,194 ; andnps %xmm2,%xmm0
+ DB 15,86,197 ; orps %xmm5,%xmm0
+ DB 15,88,198 ; addps %xmm6,%xmm0
+ DB 15,84,204 ; andps %xmm4,%xmm1
+ DB 15,85,224 ; andnps %xmm0,%xmm4
+ DB 15,86,225 ; orps %xmm1,%xmm4
+ DB 15,40,235 ; movaps %xmm3,%xmm5
+ DB 15,88,109,232 ; addps -0x18(%ebp),%xmm5
+ DB 139,77,12 ; mov 0xc(%ebp),%ecx
+ DB 141,81,4 ; lea 0x4(%ecx),%edx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 15,40,69,152 ; movaps -0x68(%ebp),%xmm0
+ DB 15,40,207 ; movaps %xmm7,%xmm1
+ DB 15,40,212 ; movaps %xmm4,%xmm2
+ DB 15,40,221 ; movaps %xmm5,%xmm3
+ DB 82 ; push %edx
+ DB 80 ; push %eax
+ DB 255,17 ; call *(%ecx)
+ DB 129,196,136,0,0,0 ; add $0x88,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -37648,133 +37162,116 @@ PUBLIC _sk_colordodge_sse2
_sk_colordodge_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 129,236,172,0,0,0 ; sub $0xac,%esp
+ DB 131,236,104 ; sub $0x68,%esp
DB 15,40,251 ; movaps %xmm3,%xmm7
- DB 15,41,85,168 ; movaps %xmm2,-0x58(%ebp)
- DB 15,41,77,184 ; movaps %xmm1,-0x48(%ebp)
+ DB 15,41,85,152 ; movaps %xmm2,-0x68(%ebp)
+ DB 15,41,77,216 ; movaps %xmm1,-0x28(%ebp)
+ DB 232,0,0,0,0 ; call afd <_sk_colordodge_sse2+0x16>
+ DB 89 ; pop %ecx
+ DB 139,69,8 ; mov 0x8(%ebp),%eax
+ DB 15,40,104,16 ; movaps 0x10(%eax),%xmm5
+ DB 15,40,177,243,100,0,0 ; movaps 0x64f3(%ecx),%xmm6
+ DB 15,40,222 ; movaps %xmm6,%xmm3
+ DB 15,92,247 ; subps %xmm7,%xmm6
+ DB 15,41,117,184 ; movaps %xmm6,-0x48(%ebp)
+ DB 15,89,245 ; mulps %xmm5,%xmm6
+ DB 15,41,109,200 ; movaps %xmm5,-0x38(%ebp)
+ DB 15,40,213 ; movaps %xmm5,%xmm2
+ DB 15,89,239 ; mulps %xmm7,%xmm5
+ DB 15,40,207 ; movaps %xmm7,%xmm1
+ DB 15,92,200 ; subps %xmm0,%xmm1
+ DB 15,94,233 ; divps %xmm1,%xmm5
+ DB 15,40,96,64 ; movaps 0x40(%eax),%xmm4
+ DB 15,40,204 ; movaps %xmm4,%xmm1
+ DB 15,93,205 ; minps %xmm5,%xmm1
+ DB 15,92,220 ; subps %xmm4,%xmm3
+ DB 15,41,93,232 ; movaps %xmm3,-0x18(%ebp)
+ DB 15,89,216 ; mulps %xmm0,%xmm3
+ DB 15,88,211 ; addps %xmm3,%xmm2
+ DB 15,89,207 ; mulps %xmm7,%xmm1
+ DB 15,88,203 ; addps %xmm3,%xmm1
DB 15,40,232 ; movaps %xmm0,%xmm5
- DB 232,0,0,0,0 ; call 1140 <_sk_colordodge_sse2+0x1f>
- DB 88 ; pop %eax
- DB 15,40,69,88 ; movaps 0x58(%ebp),%xmm0
- DB 15,40,77,40 ; movaps 0x28(%ebp),%xmm1
- DB 15,40,215 ; movaps %xmm7,%xmm2
- DB 15,89,209 ; mulps %xmm1,%xmm2
- DB 15,40,231 ; movaps %xmm7,%xmm4
- DB 15,92,229 ; subps %xmm5,%xmm4
- DB 15,94,212 ; divps %xmm4,%xmm2
- DB 15,40,224 ; movaps %xmm0,%xmm4
- DB 15,93,226 ; minps %xmm2,%xmm4
- DB 15,40,152,144,129,0,0 ; movaps 0x8190(%eax),%xmm3
- DB 15,40,211 ; movaps %xmm3,%xmm2
- DB 15,92,208 ; subps %xmm0,%xmm2
- DB 15,41,85,216 ; movaps %xmm2,-0x28(%ebp)
- DB 15,89,213 ; mulps %xmm5,%xmm2
- DB 15,40,197 ; movaps %xmm5,%xmm0
- DB 15,194,199,0 ; cmpeqps %xmm7,%xmm0
- DB 15,89,231 ; mulps %xmm7,%xmm4
- DB 15,88,226 ; addps %xmm2,%xmm4
- DB 15,84,232 ; andps %xmm0,%xmm5
- DB 15,85,196 ; andnps %xmm4,%xmm0
- DB 15,86,197 ; orps %xmm5,%xmm0
- DB 15,92,223 ; subps %xmm7,%xmm3
+ DB 15,194,239,0 ; cmpeqps %xmm7,%xmm5
+ DB 15,84,197 ; andps %xmm5,%xmm0
+ DB 15,85,233 ; andnps %xmm1,%xmm5
+ DB 15,86,232 ; orps %xmm0,%xmm5
+ DB 15,88,238 ; addps %xmm6,%xmm5
+ DB 15,87,192 ; xorps %xmm0,%xmm0
+ DB 15,40,93,200 ; movaps -0x38(%ebp),%xmm3
+ DB 15,194,216,0 ; cmpeqps %xmm0,%xmm3
+ DB 15,84,211 ; andps %xmm3,%xmm2
+ DB 15,85,221 ; andnps %xmm5,%xmm3
+ DB 15,86,218 ; orps %xmm2,%xmm3
DB 15,41,93,200 ; movaps %xmm3,-0x38(%ebp)
- DB 15,89,217 ; mulps %xmm1,%xmm3
- DB 15,88,195 ; addps %xmm3,%xmm0
- DB 15,87,228 ; xorps %xmm4,%xmm4
- DB 15,40,233 ; movaps %xmm1,%xmm5
- DB 15,194,236,0 ; cmpeqps %xmm4,%xmm5
- DB 15,88,209 ; addps %xmm1,%xmm2
- DB 15,84,213 ; andps %xmm5,%xmm2
- DB 15,85,232 ; andnps %xmm0,%xmm5
- DB 15,86,234 ; orps %xmm2,%xmm5
- DB 15,40,93,56 ; movaps 0x38(%ebp),%xmm3
- DB 15,40,199 ; movaps %xmm7,%xmm0
- DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,40,247 ; movaps %xmm7,%xmm6
+ DB 15,40,64,32 ; movaps 0x20(%eax),%xmm0
DB 15,40,77,184 ; movaps -0x48(%ebp),%xmm1
- DB 15,92,241 ; subps %xmm1,%xmm6
- DB 15,94,198 ; divps %xmm6,%xmm0
- DB 15,40,117,88 ; movaps 0x58(%ebp),%xmm6
- DB 15,93,240 ; minps %xmm0,%xmm6
- DB 15,40,85,216 ; movaps -0x28(%ebp),%xmm2
- DB 15,89,209 ; mulps %xmm1,%xmm2
- DB 15,40,193 ; movaps %xmm1,%xmm0
- DB 15,194,207,0 ; cmpeqps %xmm7,%xmm1
- DB 15,89,247 ; mulps %xmm7,%xmm6
- DB 15,88,242 ; addps %xmm2,%xmm6
- DB 15,84,193 ; andps %xmm1,%xmm0
- DB 15,85,206 ; andnps %xmm6,%xmm1
- DB 15,86,200 ; orps %xmm0,%xmm1
- DB 15,40,117,200 ; movaps -0x38(%ebp),%xmm6
- DB 15,89,243 ; mulps %xmm3,%xmm6
- DB 15,88,206 ; addps %xmm6,%xmm1
- DB 15,40,243 ; movaps %xmm3,%xmm6
- DB 15,194,244,0 ; cmpeqps %xmm4,%xmm6
- DB 15,88,211 ; addps %xmm3,%xmm2
- DB 15,84,214 ; andps %xmm6,%xmm2
- DB 15,85,241 ; andnps %xmm1,%xmm6
- DB 15,86,242 ; orps %xmm2,%xmm6
- DB 15,40,207 ; movaps %xmm7,%xmm1
- DB 15,89,77,72 ; mulps 0x48(%ebp),%xmm1
+ DB 15,89,200 ; mulps %xmm0,%xmm1
+ DB 15,40,232 ; movaps %xmm0,%xmm5
+ DB 15,40,240 ; movaps %xmm0,%xmm6
+ DB 15,89,199 ; mulps %xmm7,%xmm0
DB 15,40,223 ; movaps %xmm7,%xmm3
- DB 15,40,69,168 ; movaps -0x58(%ebp),%xmm0
- DB 15,92,216 ; subps %xmm0,%xmm3
- DB 15,94,203 ; divps %xmm3,%xmm1
- DB 15,40,93,88 ; movaps 0x58(%ebp),%xmm3
- DB 15,93,217 ; minps %xmm1,%xmm3
DB 15,40,85,216 ; movaps -0x28(%ebp),%xmm2
- DB 15,89,208 ; mulps %xmm0,%xmm2
- DB 15,41,85,216 ; movaps %xmm2,-0x28(%ebp)
- DB 15,40,200 ; movaps %xmm0,%xmm1
- DB 15,194,207,0 ; cmpeqps %xmm7,%xmm1
+ DB 15,92,218 ; subps %xmm2,%xmm3
+ DB 15,94,195 ; divps %xmm3,%xmm0
+ DB 15,40,220 ; movaps %xmm4,%xmm3
+ DB 15,93,216 ; minps %xmm0,%xmm3
+ DB 15,40,69,232 ; movaps -0x18(%ebp),%xmm0
+ DB 15,89,194 ; mulps %xmm2,%xmm0
+ DB 15,88,240 ; addps %xmm0,%xmm6
DB 15,89,223 ; mulps %xmm7,%xmm3
- DB 15,88,218 ; addps %xmm2,%xmm3
- DB 15,84,193 ; andps %xmm1,%xmm0
- DB 15,85,203 ; andnps %xmm3,%xmm1
- DB 15,86,200 ; orps %xmm0,%xmm1
- DB 15,40,69,200 ; movaps -0x38(%ebp),%xmm0
- DB 15,40,216 ; movaps %xmm0,%xmm3
- DB 15,40,85,72 ; movaps 0x48(%ebp),%xmm2
+ DB 15,88,216 ; addps %xmm0,%xmm3
+ DB 15,40,194 ; movaps %xmm2,%xmm0
+ DB 15,194,199,0 ; cmpeqps %xmm7,%xmm0
+ DB 15,84,208 ; andps %xmm0,%xmm2
+ DB 15,85,195 ; andnps %xmm3,%xmm0
+ DB 15,86,194 ; orps %xmm2,%xmm0
+ DB 15,88,193 ; addps %xmm1,%xmm0
+ DB 15,87,210 ; xorps %xmm2,%xmm2
+ DB 15,194,234,0 ; cmpeqps %xmm2,%xmm5
+ DB 15,84,245 ; andps %xmm5,%xmm6
+ DB 15,85,232 ; andnps %xmm0,%xmm5
+ DB 15,86,238 ; orps %xmm6,%xmm5
+ DB 15,40,72,48 ; movaps 0x30(%eax),%xmm1
+ DB 15,194,209,0 ; cmpeqps %xmm1,%xmm2
+ DB 15,41,85,216 ; movaps %xmm2,-0x28(%ebp)
+ DB 15,40,85,152 ; movaps -0x68(%ebp),%xmm2
+ DB 15,40,93,232 ; movaps -0x18(%ebp),%xmm3
DB 15,89,218 ; mulps %xmm2,%xmm3
- DB 15,88,203 ; addps %xmm3,%xmm1
- DB 15,194,226,0 ; cmpeqps %xmm2,%xmm4
- DB 15,40,93,216 ; movaps -0x28(%ebp),%xmm3
- DB 15,88,218 ; addps %xmm2,%xmm3
- DB 15,84,220 ; andps %xmm4,%xmm3
- DB 15,85,225 ; andnps %xmm1,%xmm4
- DB 15,86,227 ; orps %xmm3,%xmm4
- DB 15,40,77,88 ; movaps 0x58(%ebp),%xmm1
- DB 15,89,193 ; mulps %xmm1,%xmm0
+ DB 15,41,93,232 ; movaps %xmm3,-0x18(%ebp)
+ DB 15,88,217 ; addps %xmm1,%xmm3
+ DB 15,40,69,184 ; movaps -0x48(%ebp),%xmm0
+ DB 15,40,240 ; movaps %xmm0,%xmm6
+ DB 15,89,241 ; mulps %xmm1,%xmm6
+ DB 15,41,117,168 ; movaps %xmm6,-0x58(%ebp)
+ DB 15,89,207 ; mulps %xmm7,%xmm1
+ DB 15,40,247 ; movaps %xmm7,%xmm6
+ DB 15,92,242 ; subps %xmm2,%xmm6
+ DB 15,94,206 ; divps %xmm6,%xmm1
+ DB 15,89,196 ; mulps %xmm4,%xmm0
+ DB 15,93,225 ; minps %xmm1,%xmm4
+ DB 15,89,231 ; mulps %xmm7,%xmm4
+ DB 15,88,101,232 ; addps -0x18(%ebp),%xmm4
+ DB 15,40,202 ; movaps %xmm2,%xmm1
+ DB 15,194,207,0 ; cmpeqps %xmm7,%xmm1
+ DB 15,84,209 ; andps %xmm1,%xmm2
+ DB 15,85,204 ; andnps %xmm4,%xmm1
+ DB 15,86,202 ; orps %xmm2,%xmm1
+ DB 15,88,77,168 ; addps -0x58(%ebp),%xmm1
+ DB 15,40,85,216 ; movaps -0x28(%ebp),%xmm2
+ DB 15,84,218 ; andps %xmm2,%xmm3
+ DB 15,85,209 ; andnps %xmm1,%xmm2
+ DB 15,86,211 ; orps %xmm3,%xmm2
DB 15,88,248 ; addps %xmm0,%xmm7
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
- DB 139,85,20 ; mov 0x14(%ebp),%edx
- DB 139,117,24 ; mov 0x18(%ebp),%esi
- DB 139,125,12 ; mov 0xc(%ebp),%edi
- DB 141,95,4 ; lea 0x4(%edi),%ebx
- DB 15,41,76,36,80 ; movaps %xmm1,0x50(%esp)
- DB 15,41,84,36,64 ; movaps %xmm2,0x40(%esp)
- DB 15,40,69,56 ; movaps 0x38(%ebp),%xmm0
- DB 15,41,68,36,48 ; movaps %xmm0,0x30(%esp)
- DB 15,40,69,40 ; movaps 0x28(%ebp),%xmm0
- DB 15,41,68,36,32 ; movaps %xmm0,0x20(%esp)
- DB 137,116,36,16 ; mov %esi,0x10(%esp)
- DB 137,84,36,12 ; mov %edx,0xc(%esp)
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
- DB 15,40,197 ; movaps %xmm5,%xmm0
- DB 15,40,206 ; movaps %xmm6,%xmm1
- DB 15,40,212 ; movaps %xmm4,%xmm2
+ DB 139,77,12 ; mov 0xc(%ebp),%ecx
+ DB 141,81,4 ; lea 0x4(%ecx),%edx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 15,40,69,200 ; movaps -0x38(%ebp),%xmm0
+ DB 15,40,205 ; movaps %xmm5,%xmm1
DB 15,40,223 ; movaps %xmm7,%xmm3
- DB 255,23 ; call *(%edi)
- DB 129,196,172,0,0,0 ; add $0xac,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 82 ; push %edx
+ DB 80 ; push %eax
+ DB 255,17 ; call *(%ecx)
+ DB 131,196,120 ; add $0x78,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -37782,124 +37279,106 @@ PUBLIC _sk_hardlight_sse2
_sk_hardlight_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 129,236,156,0,0,0 ; sub $0x9c,%esp
- DB 15,40,250 ; movaps %xmm2,%xmm7
- DB 15,40,233 ; movaps %xmm1,%xmm5
- DB 15,40,224 ; movaps %xmm0,%xmm4
- DB 232,0,0,0,0 ; call 12e2 <_sk_hardlight_sse2+0x1a>
- DB 88 ; pop %eax
- DB 15,40,176,254,127,0,0 ; movaps 0x7ffe(%eax),%xmm6
- DB 15,40,206 ; movaps %xmm6,%xmm1
- DB 15,92,77,88 ; subps 0x58(%ebp),%xmm1
- DB 15,41,77,184 ; movaps %xmm1,-0x48(%ebp)
- DB 15,40,193 ; movaps %xmm1,%xmm0
- DB 15,89,196 ; mulps %xmm4,%xmm0
- DB 15,40,211 ; movaps %xmm3,%xmm2
+ DB 131,236,88 ; sub $0x58,%esp
+ DB 15,40,243 ; movaps %xmm3,%xmm6
+ DB 15,41,85,168 ; movaps %xmm2,-0x58(%ebp)
+ DB 15,41,77,232 ; movaps %xmm1,-0x18(%ebp)
+ DB 232,0,0,0,0 ; call c69 <_sk_hardlight_sse2+0x16>
+ DB 89 ; pop %ecx
+ DB 139,69,8 ; mov 0x8(%ebp),%eax
+ DB 15,40,72,64 ; movaps 0x40(%eax),%xmm1
+ DB 15,40,145,151,99,0,0 ; movaps 0x6397(%ecx),%xmm2
+ DB 15,40,234 ; movaps %xmm2,%xmm5
+ DB 15,92,233 ; subps %xmm1,%xmm5
+ DB 15,40,225 ; movaps %xmm1,%xmm4
+ DB 15,40,253 ; movaps %xmm5,%xmm7
+ DB 15,89,248 ; mulps %xmm0,%xmm7
+ DB 15,92,214 ; subps %xmm6,%xmm2
+ DB 15,41,85,200 ; movaps %xmm2,-0x38(%ebp)
+ DB 15,40,88,16 ; movaps 0x10(%eax),%xmm3
+ DB 15,40,202 ; movaps %xmm2,%xmm1
+ DB 15,89,203 ; mulps %xmm3,%xmm1
+ DB 15,88,207 ; addps %xmm7,%xmm1
+ DB 15,40,212 ; movaps %xmm4,%xmm2
DB 15,41,85,216 ; movaps %xmm2,-0x28(%ebp)
- DB 15,92,242 ; subps %xmm2,%xmm6
- DB 15,40,222 ; movaps %xmm6,%xmm3
- DB 15,41,93,200 ; movaps %xmm3,-0x38(%ebp)
- DB 15,40,77,40 ; movaps 0x28(%ebp),%xmm1
- DB 15,89,217 ; mulps %xmm1,%xmm3
- DB 15,88,216 ; addps %xmm0,%xmm3
- DB 15,40,242 ; movaps %xmm2,%xmm6
- DB 15,92,244 ; subps %xmm4,%xmm6
- DB 15,40,69,88 ; movaps 0x58(%ebp),%xmm0
- DB 15,92,193 ; subps %xmm1,%xmm0
- DB 15,89,198 ; mulps %xmm6,%xmm0
- DB 15,40,77,216 ; movaps -0x28(%ebp),%xmm1
- DB 15,40,209 ; movaps %xmm1,%xmm2
- DB 15,89,85,88 ; mulps 0x58(%ebp),%xmm2
- DB 15,88,192 ; addps %xmm0,%xmm0
- DB 15,40,242 ; movaps %xmm2,%xmm6
- DB 15,92,240 ; subps %xmm0,%xmm6
- DB 15,40,196 ; movaps %xmm4,%xmm0
- DB 15,88,192 ; addps %xmm0,%xmm0
- DB 15,194,193,2 ; cmpleps %xmm1,%xmm0
- DB 15,89,101,40 ; mulps 0x28(%ebp),%xmm4
- DB 15,88,228 ; addps %xmm4,%xmm4
- DB 15,84,224 ; andps %xmm0,%xmm4
- DB 15,85,198 ; andnps %xmm6,%xmm0
- DB 15,86,196 ; orps %xmm4,%xmm0
- DB 15,88,195 ; addps %xmm3,%xmm0
- DB 15,40,93,184 ; movaps -0x48(%ebp),%xmm3
- DB 15,89,221 ; mulps %xmm5,%xmm3
- DB 15,40,117,200 ; movaps -0x38(%ebp),%xmm6
- DB 15,89,117,56 ; mulps 0x38(%ebp),%xmm6
- DB 15,88,243 ; addps %xmm3,%xmm6
- DB 15,40,217 ; movaps %xmm1,%xmm3
- DB 15,92,221 ; subps %xmm5,%xmm3
- DB 15,40,101,88 ; movaps 0x58(%ebp),%xmm4
- DB 15,92,101,56 ; subps 0x38(%ebp),%xmm4
- DB 15,89,227 ; mulps %xmm3,%xmm4
+ DB 15,40,250 ; movaps %xmm2,%xmm7
+ DB 15,92,251 ; subps %xmm3,%xmm7
+ DB 15,40,230 ; movaps %xmm6,%xmm4
+ DB 15,92,224 ; subps %xmm0,%xmm4
+ DB 15,89,231 ; mulps %xmm7,%xmm4
+ DB 15,40,250 ; movaps %xmm2,%xmm7
+ DB 15,89,254 ; mulps %xmm6,%xmm7
+ DB 15,41,125,184 ; movaps %xmm7,-0x48(%ebp)
DB 15,88,228 ; addps %xmm4,%xmm4
- DB 15,40,218 ; movaps %xmm2,%xmm3
- DB 15,92,220 ; subps %xmm4,%xmm3
- DB 15,40,229 ; movaps %xmm5,%xmm4
+ DB 15,92,252 ; subps %xmm4,%xmm7
+ DB 15,89,216 ; mulps %xmm0,%xmm3
+ DB 15,40,224 ; movaps %xmm0,%xmm4
DB 15,88,228 ; addps %xmm4,%xmm4
- DB 15,194,225,2 ; cmpleps %xmm1,%xmm4
- DB 15,89,109,56 ; mulps 0x38(%ebp),%xmm5
- DB 15,88,237 ; addps %xmm5,%xmm5
- DB 15,84,236 ; andps %xmm4,%xmm5
- DB 15,85,227 ; andnps %xmm3,%xmm4
- DB 15,86,229 ; orps %xmm5,%xmm4
- DB 15,88,230 ; addps %xmm6,%xmm4
- DB 15,40,109,184 ; movaps -0x48(%ebp),%xmm5
+ DB 15,194,230,2 ; cmpleps %xmm6,%xmm4
+ DB 15,88,219 ; addps %xmm3,%xmm3
+ DB 15,84,220 ; andps %xmm4,%xmm3
+ DB 15,85,231 ; andnps %xmm7,%xmm4
+ DB 15,86,227 ; orps %xmm3,%xmm4
+ DB 15,88,225 ; addps %xmm1,%xmm4
+ DB 15,40,205 ; movaps %xmm5,%xmm1
+ DB 15,40,85,232 ; movaps -0x18(%ebp),%xmm2
+ DB 15,89,202 ; mulps %xmm2,%xmm1
+ DB 15,40,88,32 ; movaps 0x20(%eax),%xmm3
+ DB 15,40,69,200 ; movaps -0x38(%ebp),%xmm0
+ DB 15,89,195 ; mulps %xmm3,%xmm0
+ DB 15,88,193 ; addps %xmm1,%xmm0
+ DB 15,40,77,216 ; movaps -0x28(%ebp),%xmm1
+ DB 15,92,203 ; subps %xmm3,%xmm1
+ DB 15,40,254 ; movaps %xmm6,%xmm7
+ DB 15,92,250 ; subps %xmm2,%xmm7
+ DB 15,89,249 ; mulps %xmm1,%xmm7
+ DB 15,88,255 ; addps %xmm7,%xmm7
+ DB 15,40,85,184 ; movaps -0x48(%ebp),%xmm2
+ DB 15,92,215 ; subps %xmm7,%xmm2
+ DB 15,40,77,232 ; movaps -0x18(%ebp),%xmm1
+ DB 15,89,217 ; mulps %xmm1,%xmm3
+ DB 15,88,201 ; addps %xmm1,%xmm1
+ DB 15,194,206,2 ; cmpleps %xmm6,%xmm1
+ DB 15,88,219 ; addps %xmm3,%xmm3
+ DB 15,84,217 ; andps %xmm1,%xmm3
+ DB 15,85,202 ; andnps %xmm2,%xmm1
+ DB 15,86,203 ; orps %xmm3,%xmm1
+ DB 15,88,200 ; addps %xmm0,%xmm1
+ DB 15,40,125,168 ; movaps -0x58(%ebp),%xmm7
DB 15,89,239 ; mulps %xmm7,%xmm5
- DB 15,40,93,72 ; movaps 0x48(%ebp),%xmm3
- DB 15,40,77,200 ; movaps -0x38(%ebp),%xmm1
- DB 15,89,203 ; mulps %xmm3,%xmm1
- DB 15,88,205 ; addps %xmm5,%xmm1
- DB 15,40,109,216 ; movaps -0x28(%ebp),%xmm5
- DB 15,92,239 ; subps %xmm7,%xmm5
- DB 15,40,117,88 ; movaps 0x58(%ebp),%xmm6
- DB 15,92,243 ; subps %xmm3,%xmm6
- DB 15,89,245 ; mulps %xmm5,%xmm6
- DB 15,88,246 ; addps %xmm6,%xmm6
- DB 15,92,214 ; subps %xmm6,%xmm2
+ DB 15,40,80,48 ; movaps 0x30(%eax),%xmm2
+ DB 15,40,93,200 ; movaps -0x38(%ebp),%xmm3
+ DB 15,40,195 ; movaps %xmm3,%xmm0
+ DB 15,89,194 ; mulps %xmm2,%xmm0
+ DB 15,88,197 ; addps %xmm5,%xmm0
+ DB 15,41,69,232 ; movaps %xmm0,-0x18(%ebp)
DB 15,40,239 ; movaps %xmm7,%xmm5
DB 15,88,237 ; addps %xmm5,%xmm5
- DB 15,40,117,216 ; movaps -0x28(%ebp),%xmm6
DB 15,194,238,2 ; cmpleps %xmm6,%xmm5
- DB 15,89,251 ; mulps %xmm3,%xmm7
- DB 15,88,255 ; addps %xmm7,%xmm7
- DB 15,84,253 ; andps %xmm5,%xmm7
- DB 15,85,234 ; andnps %xmm2,%xmm5
- DB 15,86,239 ; orps %xmm7,%xmm5
- DB 15,88,233 ; addps %xmm1,%xmm5
- DB 15,40,85,88 ; movaps 0x58(%ebp),%xmm2
- DB 15,40,93,200 ; movaps -0x38(%ebp),%xmm3
- DB 15,89,218 ; mulps %xmm2,%xmm3
- DB 15,88,243 ; addps %xmm3,%xmm6
- DB 15,40,222 ; movaps %xmm6,%xmm3
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
- DB 139,85,20 ; mov 0x14(%ebp),%edx
- DB 139,117,24 ; mov 0x18(%ebp),%esi
- DB 139,125,12 ; mov 0xc(%ebp),%edi
- DB 141,95,4 ; lea 0x4(%edi),%ebx
- DB 15,41,84,36,80 ; movaps %xmm2,0x50(%esp)
- DB 15,40,77,72 ; movaps 0x48(%ebp),%xmm1
- DB 15,41,76,36,64 ; movaps %xmm1,0x40(%esp)
- DB 15,40,77,56 ; movaps 0x38(%ebp),%xmm1
- DB 15,41,76,36,48 ; movaps %xmm1,0x30(%esp)
- DB 15,40,77,40 ; movaps 0x28(%ebp),%xmm1
- DB 15,41,76,36,32 ; movaps %xmm1,0x20(%esp)
- DB 137,116,36,16 ; mov %esi,0x10(%esp)
- DB 137,84,36,12 ; mov %edx,0xc(%esp)
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
- DB 15,40,204 ; movaps %xmm4,%xmm1
+ DB 15,40,69,216 ; movaps -0x28(%ebp),%xmm0
+ DB 15,89,216 ; mulps %xmm0,%xmm3
+ DB 15,92,194 ; subps %xmm2,%xmm0
+ DB 15,89,215 ; mulps %xmm7,%xmm2
+ DB 15,88,222 ; addps %xmm6,%xmm3
+ DB 15,92,247 ; subps %xmm7,%xmm6
+ DB 15,89,240 ; mulps %xmm0,%xmm6
+ DB 15,88,246 ; addps %xmm6,%xmm6
+ DB 15,40,125,184 ; movaps -0x48(%ebp),%xmm7
+ DB 15,92,254 ; subps %xmm6,%xmm7
+ DB 15,88,210 ; addps %xmm2,%xmm2
+ DB 15,84,213 ; andps %xmm5,%xmm2
+ DB 15,85,239 ; andnps %xmm7,%xmm5
+ DB 15,86,234 ; orps %xmm2,%xmm5
+ DB 15,88,109,232 ; addps -0x18(%ebp),%xmm5
+ DB 139,77,12 ; mov 0xc(%ebp),%ecx
+ DB 141,81,4 ; lea 0x4(%ecx),%edx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 15,40,196 ; movaps %xmm4,%xmm0
DB 15,40,213 ; movaps %xmm5,%xmm2
- DB 255,23 ; call *(%edi)
- DB 129,196,156,0,0,0 ; add $0x9c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 82 ; push %edx
+ DB 80 ; push %eax
+ DB 255,17 ; call *(%ecx)
+ DB 131,196,104 ; add $0x68,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -37907,126 +37386,111 @@ PUBLIC _sk_overlay_sse2
_sk_overlay_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 129,236,156,0,0,0 ; sub $0x9c,%esp
- DB 15,41,85,184 ; movaps %xmm2,-0x48(%ebp)
- DB 15,40,224 ; movaps %xmm0,%xmm4
- DB 232,0,0,0,0 ; call 146d <_sk_overlay_sse2+0x18>
- DB 88 ; pop %eax
- DB 15,40,69,88 ; movaps 0x58(%ebp),%xmm0
- DB 15,40,144,131,126,0,0 ; movaps 0x7e83(%eax),%xmm2
- DB 15,40,234 ; movaps %xmm2,%xmm5
- DB 15,92,232 ; subps %xmm0,%xmm5
- DB 15,40,248 ; movaps %xmm0,%xmm7
- DB 15,40,197 ; movaps %xmm5,%xmm0
- DB 15,89,196 ; mulps %xmm4,%xmm0
- DB 15,92,211 ; subps %xmm3,%xmm2
- DB 15,41,85,216 ; movaps %xmm2,-0x28(%ebp)
- DB 15,89,85,40 ; mulps 0x28(%ebp),%xmm2
- DB 15,88,208 ; addps %xmm0,%xmm2
- DB 15,40,243 ; movaps %xmm3,%xmm6
- DB 15,41,93,200 ; movaps %xmm3,-0x38(%ebp)
- DB 15,92,244 ; subps %xmm4,%xmm6
- DB 15,40,199 ; movaps %xmm7,%xmm0
- DB 15,40,125,40 ; movaps 0x28(%ebp),%xmm7
- DB 15,92,199 ; subps %xmm7,%xmm0
- DB 15,89,198 ; mulps %xmm6,%xmm0
- DB 15,40,251 ; movaps %xmm3,%xmm7
- DB 15,40,93,88 ; movaps 0x58(%ebp),%xmm3
- DB 15,89,251 ; mulps %xmm3,%xmm7
- DB 15,88,192 ; addps %xmm0,%xmm0
- DB 15,40,247 ; movaps %xmm7,%xmm6
- DB 15,92,240 ; subps %xmm0,%xmm6
- DB 15,40,69,40 ; movaps 0x28(%ebp),%xmm0
- DB 15,88,192 ; addps %xmm0,%xmm0
- DB 15,194,195,2 ; cmpleps %xmm3,%xmm0
- DB 15,89,101,40 ; mulps 0x28(%ebp),%xmm4
- DB 15,88,228 ; addps %xmm4,%xmm4
- DB 15,84,224 ; andps %xmm0,%xmm4
- DB 15,85,198 ; andnps %xmm6,%xmm0
- DB 15,86,196 ; orps %xmm4,%xmm0
- DB 15,88,194 ; addps %xmm2,%xmm0
- DB 15,40,213 ; movaps %xmm5,%xmm2
- DB 15,89,209 ; mulps %xmm1,%xmm2
- DB 15,40,93,216 ; movaps -0x28(%ebp),%xmm3
- DB 15,40,243 ; movaps %xmm3,%xmm6
- DB 15,89,117,56 ; mulps 0x38(%ebp),%xmm6
- DB 15,88,242 ; addps %xmm2,%xmm6
- DB 15,40,85,200 ; movaps -0x38(%ebp),%xmm2
- DB 15,92,209 ; subps %xmm1,%xmm2
- DB 15,40,101,88 ; movaps 0x58(%ebp),%xmm4
- DB 15,40,93,56 ; movaps 0x38(%ebp),%xmm3
+ DB 131,236,104 ; sub $0x68,%esp
+ DB 15,41,93,232 ; movaps %xmm3,-0x18(%ebp)
+ DB 15,41,85,152 ; movaps %xmm2,-0x68(%ebp)
+ DB 15,41,77,168 ; movaps %xmm1,-0x58(%ebp)
+ DB 15,40,232 ; movaps %xmm0,%xmm5
+ DB 232,0,0,0,0 ; call db4 <_sk_overlay_sse2+0x1a>
+ DB 89 ; pop %ecx
+ DB 139,69,8 ; mov 0x8(%ebp),%eax
+ DB 15,40,80,64 ; movaps 0x40(%eax),%xmm2
+ DB 15,40,161,92,98,0,0 ; movaps 0x625c(%ecx),%xmm4
+ DB 15,40,244 ; movaps %xmm4,%xmm6
+ DB 15,92,242 ; subps %xmm2,%xmm6
+ DB 15,40,206 ; movaps %xmm6,%xmm1
+ DB 15,89,205 ; mulps %xmm5,%xmm1
DB 15,92,227 ; subps %xmm3,%xmm4
- DB 15,89,226 ; mulps %xmm2,%xmm4
- DB 15,88,228 ; addps %xmm4,%xmm4
- DB 15,40,215 ; movaps %xmm7,%xmm2
- DB 15,92,212 ; subps %xmm4,%xmm2
- DB 15,40,227 ; movaps %xmm3,%xmm4
+ DB 15,41,101,200 ; movaps %xmm4,-0x38(%ebp)
+ DB 15,40,64,16 ; movaps 0x10(%eax),%xmm0
+ DB 15,40,220 ; movaps %xmm4,%xmm3
+ DB 15,89,216 ; mulps %xmm0,%xmm3
+ DB 15,88,217 ; addps %xmm1,%xmm3
+ DB 15,40,250 ; movaps %xmm2,%xmm7
+ DB 15,92,248 ; subps %xmm0,%xmm7
+ DB 15,41,69,216 ; movaps %xmm0,-0x28(%ebp)
+ DB 15,89,197 ; mulps %xmm5,%xmm0
+ DB 15,40,77,232 ; movaps -0x18(%ebp),%xmm1
+ DB 15,40,225 ; movaps %xmm1,%xmm4
+ DB 15,92,229 ; subps %xmm5,%xmm4
+ DB 15,89,231 ; mulps %xmm7,%xmm4
+ DB 15,40,234 ; movaps %xmm2,%xmm5
+ DB 15,89,233 ; mulps %xmm1,%xmm5
+ DB 15,41,109,184 ; movaps %xmm5,-0x48(%ebp)
DB 15,88,228 ; addps %xmm4,%xmm4
- DB 15,194,101,88,2 ; cmpleps 0x58(%ebp),%xmm4
- DB 15,89,203 ; mulps %xmm3,%xmm1
+ DB 15,92,236 ; subps %xmm4,%xmm5
+ DB 15,40,77,216 ; movaps -0x28(%ebp),%xmm1
DB 15,88,201 ; addps %xmm1,%xmm1
- DB 15,84,204 ; andps %xmm4,%xmm1
- DB 15,85,226 ; andnps %xmm2,%xmm4
- DB 15,86,225 ; orps %xmm1,%xmm4
- DB 15,88,230 ; addps %xmm6,%xmm4
- DB 15,40,117,184 ; movaps -0x48(%ebp),%xmm6
- DB 15,89,238 ; mulps %xmm6,%xmm5
- DB 15,40,85,216 ; movaps -0x28(%ebp),%xmm2
- DB 15,89,85,72 ; mulps 0x48(%ebp),%xmm2
- DB 15,88,213 ; addps %xmm5,%xmm2
- DB 15,40,77,200 ; movaps -0x38(%ebp),%xmm1
- DB 15,40,233 ; movaps %xmm1,%xmm5
- DB 15,92,238 ; subps %xmm6,%xmm5
- DB 15,40,117,88 ; movaps 0x58(%ebp),%xmm6
- DB 15,92,117,72 ; subps 0x48(%ebp),%xmm6
- DB 15,89,245 ; mulps %xmm5,%xmm6
- DB 15,88,246 ; addps %xmm6,%xmm6
- DB 15,92,254 ; subps %xmm6,%xmm7
- DB 15,40,93,72 ; movaps 0x48(%ebp),%xmm3
+ DB 15,194,202,2 ; cmpleps %xmm2,%xmm1
+ DB 15,88,192 ; addps %xmm0,%xmm0
+ DB 15,84,193 ; andps %xmm1,%xmm0
+ DB 15,85,205 ; andnps %xmm5,%xmm1
+ DB 15,86,200 ; orps %xmm0,%xmm1
+ DB 15,88,203 ; addps %xmm3,%xmm1
+ DB 15,41,77,216 ; movaps %xmm1,-0x28(%ebp)
+ DB 15,40,206 ; movaps %xmm6,%xmm1
+ DB 15,40,69,168 ; movaps -0x58(%ebp),%xmm0
+ DB 15,89,200 ; mulps %xmm0,%xmm1
+ DB 15,40,88,32 ; movaps 0x20(%eax),%xmm3
+ DB 15,40,101,200 ; movaps -0x38(%ebp),%xmm4
+ DB 15,89,227 ; mulps %xmm3,%xmm4
+ DB 15,88,225 ; addps %xmm1,%xmm4
+ DB 15,40,202 ; movaps %xmm2,%xmm1
+ DB 15,92,203 ; subps %xmm3,%xmm1
DB 15,40,235 ; movaps %xmm3,%xmm5
+ DB 15,89,216 ; mulps %xmm0,%xmm3
+ DB 15,40,125,232 ; movaps -0x18(%ebp),%xmm7
+ DB 15,92,248 ; subps %xmm0,%xmm7
+ DB 15,89,249 ; mulps %xmm1,%xmm7
+ DB 15,88,255 ; addps %xmm7,%xmm7
+ DB 15,40,77,184 ; movaps -0x48(%ebp),%xmm1
+ DB 15,92,207 ; subps %xmm7,%xmm1
DB 15,88,237 ; addps %xmm5,%xmm5
- DB 15,40,117,88 ; movaps 0x58(%ebp),%xmm6
- DB 15,194,238,2 ; cmpleps %xmm6,%xmm5
- DB 15,40,117,184 ; movaps -0x48(%ebp),%xmm6
+ DB 15,40,250 ; movaps %xmm2,%xmm7
+ DB 15,194,239,2 ; cmpleps %xmm7,%xmm5
+ DB 15,88,219 ; addps %xmm3,%xmm3
+ DB 15,84,221 ; andps %xmm5,%xmm3
+ DB 15,85,233 ; andnps %xmm1,%xmm5
+ DB 15,86,235 ; orps %xmm3,%xmm5
+ DB 15,88,236 ; addps %xmm4,%xmm5
+ DB 15,40,93,152 ; movaps -0x68(%ebp),%xmm3
DB 15,89,243 ; mulps %xmm3,%xmm6
+ DB 15,40,72,48 ; movaps 0x30(%eax),%xmm1
+ DB 15,40,101,200 ; movaps -0x38(%ebp),%xmm4
+ DB 15,40,212 ; movaps %xmm4,%xmm2
+ DB 15,89,209 ; mulps %xmm1,%xmm2
+ DB 15,88,214 ; addps %xmm6,%xmm2
+ DB 15,40,241 ; movaps %xmm1,%xmm6
DB 15,88,246 ; addps %xmm6,%xmm6
- DB 15,84,245 ; andps %xmm5,%xmm6
- DB 15,85,239 ; andnps %xmm7,%xmm5
- DB 15,86,238 ; orps %xmm6,%xmm5
- DB 15,88,234 ; addps %xmm2,%xmm5
- DB 15,40,85,88 ; movaps 0x58(%ebp),%xmm2
- DB 15,40,117,216 ; movaps -0x28(%ebp),%xmm6
- DB 15,89,242 ; mulps %xmm2,%xmm6
- DB 15,40,217 ; movaps %xmm1,%xmm3
- DB 15,88,222 ; addps %xmm6,%xmm3
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
- DB 139,85,20 ; mov 0x14(%ebp),%edx
- DB 139,117,24 ; mov 0x18(%ebp),%esi
- DB 139,125,12 ; mov 0xc(%ebp),%edi
- DB 141,95,4 ; lea 0x4(%edi),%ebx
- DB 15,41,84,36,80 ; movaps %xmm2,0x50(%esp)
- DB 15,40,77,72 ; movaps 0x48(%ebp),%xmm1
- DB 15,41,76,36,64 ; movaps %xmm1,0x40(%esp)
- DB 15,40,77,56 ; movaps 0x38(%ebp),%xmm1
- DB 15,41,76,36,48 ; movaps %xmm1,0x30(%esp)
- DB 15,40,77,40 ; movaps 0x28(%ebp),%xmm1
- DB 15,41,76,36,32 ; movaps %xmm1,0x20(%esp)
- DB 137,116,36,16 ; mov %esi,0x10(%esp)
- DB 137,84,36,12 ; mov %edx,0xc(%esp)
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
- DB 15,40,204 ; movaps %xmm4,%xmm1
- DB 15,40,213 ; movaps %xmm5,%xmm2
- DB 255,23 ; call *(%edi)
- DB 129,196,156,0,0,0 ; add $0x9c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 15,194,247,2 ; cmpleps %xmm7,%xmm6
+ DB 15,89,231 ; mulps %xmm7,%xmm4
+ DB 15,92,249 ; subps %xmm1,%xmm7
+ DB 15,40,199 ; movaps %xmm7,%xmm0
+ DB 15,89,203 ; mulps %xmm3,%xmm1
+ DB 15,40,251 ; movaps %xmm3,%xmm7
+ DB 15,40,93,232 ; movaps -0x18(%ebp),%xmm3
+ DB 15,88,227 ; addps %xmm3,%xmm4
+ DB 15,92,223 ; subps %xmm7,%xmm3
+ DB 15,89,216 ; mulps %xmm0,%xmm3
+ DB 15,88,219 ; addps %xmm3,%xmm3
+ DB 15,40,125,184 ; movaps -0x48(%ebp),%xmm7
+ DB 15,92,251 ; subps %xmm3,%xmm7
+ DB 15,88,201 ; addps %xmm1,%xmm1
+ DB 15,84,206 ; andps %xmm6,%xmm1
+ DB 15,85,247 ; andnps %xmm7,%xmm6
+ DB 15,86,241 ; orps %xmm1,%xmm6
+ DB 15,88,242 ; addps %xmm2,%xmm6
+ DB 139,77,12 ; mov 0xc(%ebp),%ecx
+ DB 141,81,4 ; lea 0x4(%ecx),%edx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 15,40,69,216 ; movaps -0x28(%ebp),%xmm0
+ DB 15,40,205 ; movaps %xmm5,%xmm1
+ DB 15,40,214 ; movaps %xmm6,%xmm2
+ DB 15,40,220 ; movaps %xmm4,%xmm3
+ DB 82 ; push %edx
+ DB 80 ; push %eax
+ DB 255,17 ; call *(%ecx)
+ DB 131,196,120 ; add $0x78,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -38034,219 +37498,206 @@ PUBLIC _sk_softlight_sse2
_sk_softlight_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 129,236,12,1,0,0 ; sub $0x10c,%esp
- DB 15,41,93,200 ; movaps %xmm3,-0x38(%ebp)
- DB 15,41,149,72,255,255,255 ; movaps %xmm2,-0xb8(%ebp)
- DB 15,41,141,88,255,255,255 ; movaps %xmm1,-0xa8(%ebp)
- DB 15,40,224 ; movaps %xmm0,%xmm4
- DB 15,40,77,40 ; movaps 0x28(%ebp),%xmm1
- DB 15,40,85,88 ; movaps 0x58(%ebp),%xmm2
- DB 15,87,219 ; xorps %xmm3,%xmm3
- DB 15,194,218,1 ; cmpltps %xmm2,%xmm3
- DB 15,41,93,184 ; movaps %xmm3,-0x48(%ebp)
- DB 15,94,202 ; divps %xmm2,%xmm1
- DB 15,84,203 ; andps %xmm3,%xmm1
- DB 15,40,193 ; movaps %xmm1,%xmm0
- DB 15,88,192 ; addps %xmm0,%xmm0
- DB 15,88,192 ; addps %xmm0,%xmm0
- DB 15,40,208 ; movaps %xmm0,%xmm2
- DB 15,89,210 ; mulps %xmm2,%xmm2
+ DB 129,236,184,0,0,0 ; sub $0xb8,%esp
+ DB 15,41,93,168 ; movaps %xmm3,-0x58(%ebp)
+ DB 15,41,149,88,255,255,255 ; movaps %xmm2,-0xa8(%ebp)
+ DB 15,41,77,136 ; movaps %xmm1,-0x78(%ebp)
+ DB 15,41,69,216 ; movaps %xmm0,-0x28(%ebp)
+ DB 139,69,8 ; mov 0x8(%ebp),%eax
+ DB 15,40,88,64 ; movaps 0x40(%eax),%xmm3
+ DB 15,87,192 ; xorps %xmm0,%xmm0
+ DB 15,194,195,1 ; cmpltps %xmm3,%xmm0
+ DB 15,41,69,200 ; movaps %xmm0,-0x38(%ebp)
+ DB 15,40,104,16 ; movaps 0x10(%eax),%xmm5
+ DB 15,40,213 ; movaps %xmm5,%xmm2
+ DB 15,94,211 ; divps %xmm3,%xmm2
+ DB 15,84,208 ; andps %xmm0,%xmm2
+ DB 15,40,202 ; movaps %xmm2,%xmm1
+ DB 15,88,201 ; addps %xmm1,%xmm1
+ DB 15,88,201 ; addps %xmm1,%xmm1
+ DB 15,40,241 ; movaps %xmm1,%xmm6
+ DB 15,89,246 ; mulps %xmm6,%xmm6
+ DB 15,88,241 ; addps %xmm1,%xmm6
+ DB 232,0,0,0,0 ; call f44 <_sk_softlight_sse2+0x52>
+ DB 89 ; pop %ecx
+ DB 15,40,194 ; movaps %xmm2,%xmm0
+ DB 15,40,137,236,96,0,0 ; movaps 0x60ec(%ecx),%xmm1
+ DB 15,41,141,104,255,255,255 ; movaps %xmm1,-0x98(%ebp)
+ DB 15,88,193 ; addps %xmm1,%xmm0
+ DB 15,89,198 ; mulps %xmm6,%xmm0
+ DB 15,40,185,220,96,0,0 ; movaps 0x60dc(%ecx),%xmm7
+ DB 15,41,125,232 ; movaps %xmm7,-0x18(%ebp)
+ DB 15,92,250 ; subps %xmm2,%xmm7
+ DB 15,82,242 ; rsqrtps %xmm2,%xmm6
+ DB 15,83,206 ; rcpps %xmm6,%xmm1
+ DB 15,92,202 ; subps %xmm2,%xmm1
+ DB 15,40,161,252,96,0,0 ; movaps 0x60fc(%ecx),%xmm4
+ DB 15,41,101,152 ; movaps %xmm4,-0x68(%ebp)
+ DB 15,89,212 ; mulps %xmm4,%xmm2
DB 15,88,208 ; addps %xmm0,%xmm2
- DB 232,0,0,0,0 ; call 163c <_sk_softlight_sse2+0x51>
- DB 88 ; pop %eax
- DB 15,40,233 ; movaps %xmm1,%xmm5
- DB 15,40,128,212,124,0,0 ; movaps 0x7cd4(%eax),%xmm0
- DB 15,41,133,120,255,255,255 ; movaps %xmm0,-0x88(%ebp)
- DB 15,88,232 ; addps %xmm0,%xmm5
- DB 15,89,234 ; mulps %xmm2,%xmm5
- DB 15,40,184,196,124,0,0 ; movaps 0x7cc4(%eax),%xmm7
- DB 15,41,125,216 ; movaps %xmm7,-0x28(%ebp)
- DB 15,92,249 ; subps %xmm1,%xmm7
- DB 15,82,209 ; rsqrtps %xmm1,%xmm2
- DB 15,83,242 ; rcpps %xmm2,%xmm6
- DB 15,92,241 ; subps %xmm1,%xmm6
- DB 15,40,128,228,124,0,0 ; movaps 0x7ce4(%eax),%xmm0
- DB 15,41,69,168 ; movaps %xmm0,-0x58(%ebp)
- DB 15,89,200 ; mulps %xmm0,%xmm1
- DB 15,88,205 ; addps %xmm5,%xmm1
- DB 15,40,69,40 ; movaps 0x28(%ebp),%xmm0
+ DB 15,40,197 ; movaps %xmm5,%xmm0
DB 15,88,192 ; addps %xmm0,%xmm0
DB 15,88,192 ; addps %xmm0,%xmm0
- DB 15,40,85,88 ; movaps 0x58(%ebp),%xmm2
- DB 15,194,194,2 ; cmpleps %xmm2,%xmm0
- DB 15,84,200 ; andps %xmm0,%xmm1
- DB 15,85,198 ; andnps %xmm6,%xmm0
- DB 15,86,193 ; orps %xmm1,%xmm0
- DB 15,40,244 ; movaps %xmm4,%xmm6
- DB 15,88,246 ; addps %xmm6,%xmm6
- DB 15,40,238 ; movaps %xmm6,%xmm5
- DB 15,40,93,200 ; movaps -0x38(%ebp),%xmm3
- DB 15,92,235 ; subps %xmm3,%xmm5
- DB 15,89,253 ; mulps %xmm5,%xmm7
- DB 15,89,234 ; mulps %xmm2,%xmm5
- DB 15,89,197 ; mulps %xmm5,%xmm0
- DB 15,40,235 ; movaps %xmm3,%xmm5
- DB 15,40,77,40 ; movaps 0x28(%ebp),%xmm1
- DB 15,89,233 ; mulps %xmm1,%xmm5
- DB 15,88,197 ; addps %xmm5,%xmm0
- DB 15,40,77,216 ; movaps -0x28(%ebp),%xmm1
- DB 15,40,233 ; movaps %xmm1,%xmm5
- DB 15,92,234 ; subps %xmm2,%xmm5
- DB 15,41,109,152 ; movaps %xmm5,-0x68(%ebp)
- DB 15,89,229 ; mulps %xmm5,%xmm4
+ DB 15,40,243 ; movaps %xmm3,%xmm6
+ DB 15,41,117,184 ; movaps %xmm6,-0x48(%ebp)
+ DB 15,194,198,2 ; cmpleps %xmm6,%xmm0
+ DB 15,84,208 ; andps %xmm0,%xmm2
+ DB 15,85,193 ; andnps %xmm1,%xmm0
+ DB 15,86,194 ; orps %xmm2,%xmm0
+ DB 15,40,85,216 ; movaps -0x28(%ebp),%xmm2
+ DB 15,88,210 ; addps %xmm2,%xmm2
+ DB 15,40,202 ; movaps %xmm2,%xmm1
+ DB 15,40,93,168 ; movaps -0x58(%ebp),%xmm3
DB 15,92,203 ; subps %xmm3,%xmm1
- DB 15,41,77,136 ; movaps %xmm1,-0x78(%ebp)
- DB 15,40,233 ; movaps %xmm1,%xmm5
- DB 15,40,77,40 ; movaps 0x28(%ebp),%xmm1
- DB 15,89,233 ; mulps %xmm1,%xmm5
- DB 15,88,229 ; addps %xmm5,%xmm4
- DB 15,40,211 ; movaps %xmm3,%xmm2
- DB 15,88,250 ; addps %xmm2,%xmm7
DB 15,89,249 ; mulps %xmm1,%xmm7
- DB 15,194,242,2 ; cmpleps %xmm2,%xmm6
- DB 15,84,254 ; andps %xmm6,%xmm7
- DB 15,85,240 ; andnps %xmm0,%xmm6
- DB 15,86,247 ; orps %xmm7,%xmm6
- DB 15,88,244 ; addps %xmm4,%xmm6
- DB 15,41,181,104,255,255,255 ; movaps %xmm6,-0x98(%ebp)
- DB 15,40,93,56 ; movaps 0x38(%ebp),%xmm3
- DB 15,40,227 ; movaps %xmm3,%xmm4
- DB 15,40,117,88 ; movaps 0x58(%ebp),%xmm6
- DB 15,94,230 ; divps %xmm6,%xmm4
- DB 15,84,101,184 ; andps -0x48(%ebp),%xmm4
- DB 15,40,196 ; movaps %xmm4,%xmm0
- DB 15,88,192 ; addps %xmm0,%xmm0
- DB 15,88,192 ; addps %xmm0,%xmm0
- DB 15,40,232 ; movaps %xmm0,%xmm5
- DB 15,89,237 ; mulps %xmm5,%xmm5
- DB 15,88,232 ; addps %xmm0,%xmm5
- DB 15,40,196 ; movaps %xmm4,%xmm0
- DB 15,88,133,120,255,255,255 ; addps -0x88(%ebp),%xmm0
- DB 15,89,197 ; mulps %xmm5,%xmm0
- DB 15,40,125,216 ; movaps -0x28(%ebp),%xmm7
+ DB 15,89,206 ; mulps %xmm6,%xmm1
+ DB 15,89,193 ; mulps %xmm1,%xmm0
+ DB 15,40,205 ; movaps %xmm5,%xmm1
+ DB 15,89,203 ; mulps %xmm3,%xmm1
+ DB 15,88,193 ; addps %xmm1,%xmm0
+ DB 15,88,251 ; addps %xmm3,%xmm7
+ DB 15,89,253 ; mulps %xmm5,%xmm7
+ DB 15,40,101,232 ; movaps -0x18(%ebp),%xmm4
+ DB 15,40,204 ; movaps %xmm4,%xmm1
+ DB 15,92,206 ; subps %xmm6,%xmm1
+ DB 15,41,141,120,255,255,255 ; movaps %xmm1,-0x88(%ebp)
+ DB 15,40,117,216 ; movaps -0x28(%ebp),%xmm6
+ DB 15,89,241 ; mulps %xmm1,%xmm6
+ DB 15,92,227 ; subps %xmm3,%xmm4
+ DB 15,41,101,216 ; movaps %xmm4,-0x28(%ebp)
+ DB 15,89,236 ; mulps %xmm4,%xmm5
+ DB 15,88,245 ; addps %xmm5,%xmm6
+ DB 15,40,206 ; movaps %xmm6,%xmm1
+ DB 15,194,211,2 ; cmpleps %xmm3,%xmm2
+ DB 15,40,243 ; movaps %xmm3,%xmm6
+ DB 15,84,250 ; andps %xmm2,%xmm7
+ DB 15,85,208 ; andnps %xmm0,%xmm2
+ DB 15,86,215 ; orps %xmm7,%xmm2
+ DB 15,88,209 ; addps %xmm1,%xmm2
+ DB 15,41,149,72,255,255,255 ; movaps %xmm2,-0xb8(%ebp)
+ DB 15,40,64,32 ; movaps 0x20(%eax),%xmm0
+ DB 15,40,224 ; movaps %xmm0,%xmm4
+ DB 15,94,101,184 ; divps -0x48(%ebp),%xmm4
+ DB 15,84,101,200 ; andps -0x38(%ebp),%xmm4
+ DB 15,40,204 ; movaps %xmm4,%xmm1
+ DB 15,88,201 ; addps %xmm1,%xmm1
+ DB 15,88,201 ; addps %xmm1,%xmm1
+ DB 15,40,217 ; movaps %xmm1,%xmm3
+ DB 15,89,219 ; mulps %xmm3,%xmm3
+ DB 15,88,217 ; addps %xmm1,%xmm3
+ DB 15,40,204 ; movaps %xmm4,%xmm1
+ DB 15,88,141,104,255,255,255 ; addps -0x98(%ebp),%xmm1
+ DB 15,89,203 ; mulps %xmm3,%xmm1
+ DB 15,40,125,232 ; movaps -0x18(%ebp),%xmm7
DB 15,92,252 ; subps %xmm4,%xmm7
- DB 15,82,236 ; rsqrtps %xmm4,%xmm5
- DB 15,83,237 ; rcpps %xmm5,%xmm5
+ DB 15,82,220 ; rsqrtps %xmm4,%xmm3
+ DB 15,83,235 ; rcpps %xmm3,%xmm5
DB 15,92,236 ; subps %xmm4,%xmm5
- DB 15,89,101,168 ; mulps -0x58(%ebp),%xmm4
- DB 15,88,224 ; addps %xmm0,%xmm4
- DB 15,40,195 ; movaps %xmm3,%xmm0
+ DB 15,89,101,152 ; mulps -0x68(%ebp),%xmm4
+ DB 15,88,225 ; addps %xmm1,%xmm4
+ DB 15,40,93,136 ; movaps -0x78(%ebp),%xmm3
+ DB 15,88,219 ; addps %xmm3,%xmm3
+ DB 15,40,203 ; movaps %xmm3,%xmm1
+ DB 15,92,206 ; subps %xmm6,%xmm1
+ DB 15,89,249 ; mulps %xmm1,%xmm7
+ DB 15,88,254 ; addps %xmm6,%xmm7
+ DB 15,89,248 ; mulps %xmm0,%xmm7
+ DB 15,40,117,216 ; movaps -0x28(%ebp),%xmm6
+ DB 15,89,240 ; mulps %xmm0,%xmm6
+ DB 15,40,208 ; movaps %xmm0,%xmm2
DB 15,88,192 ; addps %xmm0,%xmm0
DB 15,88,192 ; addps %xmm0,%xmm0
- DB 15,194,198,2 ; cmpleps %xmm6,%xmm0
+ DB 15,194,69,184,2 ; cmpleps -0x48(%ebp),%xmm0
DB 15,84,224 ; andps %xmm0,%xmm4
DB 15,85,197 ; andnps %xmm5,%xmm0
DB 15,86,196 ; orps %xmm4,%xmm0
- DB 15,40,141,88,255,255,255 ; movaps -0xa8(%ebp),%xmm1
- DB 15,40,225 ; movaps %xmm1,%xmm4
- DB 15,88,228 ; addps %xmm4,%xmm4
- DB 15,40,236 ; movaps %xmm4,%xmm5
- DB 15,92,234 ; subps %xmm2,%xmm5
- DB 15,89,253 ; mulps %xmm5,%xmm7
- DB 15,89,238 ; mulps %xmm6,%xmm5
- DB 15,89,197 ; mulps %xmm5,%xmm0
- DB 15,40,234 ; movaps %xmm2,%xmm5
- DB 15,89,235 ; mulps %xmm3,%xmm5
- DB 15,88,197 ; addps %xmm5,%xmm0
- DB 15,89,77,152 ; mulps -0x68(%ebp),%xmm1
- DB 15,40,109,136 ; movaps -0x78(%ebp),%xmm5
- DB 15,89,235 ; mulps %xmm3,%xmm5
- DB 15,88,205 ; addps %xmm5,%xmm1
- DB 15,40,233 ; movaps %xmm1,%xmm5
- DB 15,88,250 ; addps %xmm2,%xmm7
- DB 15,89,251 ; mulps %xmm3,%xmm7
- DB 15,194,226,2 ; cmpleps %xmm2,%xmm4
- DB 15,84,252 ; andps %xmm4,%xmm7
- DB 15,85,224 ; andnps %xmm0,%xmm4
- DB 15,86,231 ; orps %xmm7,%xmm4
- DB 15,88,229 ; addps %xmm5,%xmm4
- DB 15,40,125,72 ; movaps 0x48(%ebp),%xmm7
- DB 15,94,254 ; divps %xmm6,%xmm7
- DB 15,84,125,184 ; andps -0x48(%ebp),%xmm7
- DB 15,40,93,216 ; movaps -0x28(%ebp),%xmm3
- DB 15,92,223 ; subps %xmm7,%xmm3
- DB 15,40,149,120,255,255,255 ; movaps -0x88(%ebp),%xmm2
- DB 15,88,215 ; addps %xmm7,%xmm2
- DB 15,40,77,168 ; movaps -0x58(%ebp),%xmm1
- DB 15,89,207 ; mulps %xmm7,%xmm1
- DB 15,82,199 ; rsqrtps %xmm7,%xmm0
- DB 15,83,192 ; rcpps %xmm0,%xmm0
- DB 15,92,199 ; subps %xmm7,%xmm0
+ DB 15,40,101,184 ; movaps -0x48(%ebp),%xmm4
+ DB 15,89,204 ; mulps %xmm4,%xmm1
+ DB 15,89,193 ; mulps %xmm1,%xmm0
+ DB 15,40,109,168 ; movaps -0x58(%ebp),%xmm5
+ DB 15,89,213 ; mulps %xmm5,%xmm2
+ DB 15,88,194 ; addps %xmm2,%xmm0
+ DB 15,40,77,136 ; movaps -0x78(%ebp),%xmm1
+ DB 15,89,141,120,255,255,255 ; mulps -0x88(%ebp),%xmm1
+ DB 15,88,206 ; addps %xmm6,%xmm1
+ DB 15,194,221,2 ; cmpleps %xmm5,%xmm3
+ DB 15,40,245 ; movaps %xmm5,%xmm6
+ DB 15,84,251 ; andps %xmm3,%xmm7
+ DB 15,85,216 ; andnps %xmm0,%xmm3
+ DB 15,86,223 ; orps %xmm7,%xmm3
+ DB 15,88,217 ; addps %xmm1,%xmm3
+ DB 15,40,64,48 ; movaps 0x30(%eax),%xmm0
+ DB 15,40,248 ; movaps %xmm0,%xmm7
+ DB 15,94,252 ; divps %xmm4,%xmm7
+ DB 15,84,125,200 ; andps -0x38(%ebp),%xmm7
+ DB 15,40,77,232 ; movaps -0x18(%ebp),%xmm1
+ DB 15,92,207 ; subps %xmm7,%xmm1
+ DB 15,41,77,232 ; movaps %xmm1,-0x18(%ebp)
+ DB 15,40,173,104,255,255,255 ; movaps -0x98(%ebp),%xmm5
+ DB 15,88,239 ; addps %xmm7,%xmm5
+ DB 15,40,101,152 ; movaps -0x68(%ebp),%xmm4
+ DB 15,89,231 ; mulps %xmm7,%xmm4
+ DB 15,82,207 ; rsqrtps %xmm7,%xmm1
+ DB 15,83,201 ; rcpps %xmm1,%xmm1
+ DB 15,92,207 ; subps %xmm7,%xmm1
+ DB 15,41,77,200 ; movaps %xmm1,-0x38(%ebp)
DB 15,88,255 ; addps %xmm7,%xmm7
DB 15,88,255 ; addps %xmm7,%xmm7
- DB 15,40,239 ; movaps %xmm7,%xmm5
- DB 15,89,237 ; mulps %xmm5,%xmm5
- DB 15,88,239 ; addps %xmm7,%xmm5
- DB 15,40,250 ; movaps %xmm2,%xmm7
- DB 15,89,253 ; mulps %xmm5,%xmm7
- DB 15,40,209 ; movaps %xmm1,%xmm2
+ DB 15,40,215 ; movaps %xmm7,%xmm2
+ DB 15,89,210 ; mulps %xmm2,%xmm2
DB 15,88,215 ; addps %xmm7,%xmm2
- DB 15,40,109,72 ; movaps 0x48(%ebp),%xmm5
- DB 15,88,237 ; addps %xmm5,%xmm5
+ DB 15,40,205 ; movaps %xmm5,%xmm1
+ DB 15,89,202 ; mulps %xmm2,%xmm1
+ DB 15,88,225 ; addps %xmm1,%xmm4
+ DB 15,40,204 ; movaps %xmm4,%xmm1
+ DB 15,40,173,88,255,255,255 ; movaps -0xa8(%ebp),%xmm5
DB 15,88,237 ; addps %xmm5,%xmm5
- DB 15,194,238,2 ; cmpleps %xmm6,%xmm5
+ DB 15,40,213 ; movaps %xmm5,%xmm2
+ DB 15,92,214 ; subps %xmm6,%xmm2
+ DB 15,40,101,232 ; movaps -0x18(%ebp),%xmm4
+ DB 15,89,226 ; mulps %xmm2,%xmm4
+ DB 15,88,230 ; addps %xmm6,%xmm4
+ DB 15,89,224 ; mulps %xmm0,%xmm4
+ DB 15,41,101,232 ; movaps %xmm4,-0x18(%ebp)
+ DB 15,40,101,216 ; movaps -0x28(%ebp),%xmm4
+ DB 15,89,224 ; mulps %xmm0,%xmm4
+ DB 15,40,240 ; movaps %xmm0,%xmm6
+ DB 15,88,192 ; addps %xmm0,%xmm0
+ DB 15,88,192 ; addps %xmm0,%xmm0
+ DB 15,40,125,184 ; movaps -0x48(%ebp),%xmm7
+ DB 15,194,199,2 ; cmpleps %xmm7,%xmm0
+ DB 15,84,200 ; andps %xmm0,%xmm1
+ DB 15,85,69,200 ; andnps -0x38(%ebp),%xmm0
+ DB 15,86,193 ; orps %xmm1,%xmm0
+ DB 15,89,215 ; mulps %xmm7,%xmm2
+ DB 15,89,194 ; mulps %xmm2,%xmm0
+ DB 15,40,85,168 ; movaps -0x58(%ebp),%xmm2
+ DB 15,89,242 ; mulps %xmm2,%xmm6
+ DB 15,88,198 ; addps %xmm6,%xmm0
+ DB 15,40,141,88,255,255,255 ; movaps -0xa8(%ebp),%xmm1
+ DB 15,89,141,120,255,255,255 ; mulps -0x88(%ebp),%xmm1
+ DB 15,88,204 ; addps %xmm4,%xmm1
+ DB 15,194,234,2 ; cmpleps %xmm2,%xmm5
+ DB 15,40,226 ; movaps %xmm2,%xmm4
+ DB 15,40,85,232 ; movaps -0x18(%ebp),%xmm2
DB 15,84,213 ; andps %xmm5,%xmm2
DB 15,85,232 ; andnps %xmm0,%xmm5
DB 15,86,234 ; orps %xmm2,%xmm5
+ DB 15,88,233 ; addps %xmm1,%xmm5
+ DB 15,40,69,216 ; movaps -0x28(%ebp),%xmm0
+ DB 15,89,199 ; mulps %xmm7,%xmm0
+ DB 15,88,224 ; addps %xmm0,%xmm4
+ DB 139,77,12 ; mov 0xc(%ebp),%ecx
+ DB 141,81,4 ; lea 0x4(%ecx),%edx
+ DB 131,236,8 ; sub $0x8,%esp
DB 15,40,133,72,255,255,255 ; movaps -0xb8(%ebp),%xmm0
- DB 15,40,77,152 ; movaps -0x68(%ebp),%xmm1
- DB 15,89,200 ; mulps %xmm0,%xmm1
- DB 15,40,208 ; movaps %xmm0,%xmm2
- DB 15,88,210 ; addps %xmm2,%xmm2
- DB 15,40,194 ; movaps %xmm2,%xmm0
- DB 15,40,125,200 ; movaps -0x38(%ebp),%xmm7
- DB 15,92,199 ; subps %xmm7,%xmm0
- DB 15,89,216 ; mulps %xmm0,%xmm3
- DB 15,41,93,216 ; movaps %xmm3,-0x28(%ebp)
- DB 15,89,198 ; mulps %xmm6,%xmm0
- DB 15,89,232 ; mulps %xmm0,%xmm5
- DB 15,40,199 ; movaps %xmm7,%xmm0
- DB 15,40,93,72 ; movaps 0x48(%ebp),%xmm3
- DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,232 ; addps %xmm0,%xmm5
- DB 15,40,117,136 ; movaps -0x78(%ebp),%xmm6
- DB 15,40,198 ; movaps %xmm6,%xmm0
- DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,193 ; addps %xmm1,%xmm0
- DB 15,40,77,216 ; movaps -0x28(%ebp),%xmm1
- DB 15,88,207 ; addps %xmm7,%xmm1
- DB 15,89,203 ; mulps %xmm3,%xmm1
- DB 15,194,215,2 ; cmpleps %xmm7,%xmm2
- DB 15,84,202 ; andps %xmm2,%xmm1
- DB 15,85,213 ; andnps %xmm5,%xmm2
- DB 15,86,209 ; orps %xmm1,%xmm2
- DB 15,88,208 ; addps %xmm0,%xmm2
- DB 15,40,69,88 ; movaps 0x58(%ebp),%xmm0
- DB 15,89,240 ; mulps %xmm0,%xmm6
- DB 15,88,254 ; addps %xmm6,%xmm7
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
- DB 139,85,20 ; mov 0x14(%ebp),%edx
- DB 139,117,24 ; mov 0x18(%ebp),%esi
- DB 139,125,12 ; mov 0xc(%ebp),%edi
- DB 141,95,4 ; lea 0x4(%edi),%ebx
- DB 15,41,68,36,80 ; movaps %xmm0,0x50(%esp)
- DB 15,41,92,36,64 ; movaps %xmm3,0x40(%esp)
- DB 15,40,69,56 ; movaps 0x38(%ebp),%xmm0
- DB 15,41,68,36,48 ; movaps %xmm0,0x30(%esp)
- DB 15,40,69,40 ; movaps 0x28(%ebp),%xmm0
- DB 15,41,68,36,32 ; movaps %xmm0,0x20(%esp)
- DB 137,116,36,16 ; mov %esi,0x10(%esp)
- DB 137,84,36,12 ; mov %edx,0xc(%esp)
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
- DB 15,40,133,104,255,255,255 ; movaps -0x98(%ebp),%xmm0
- DB 15,40,204 ; movaps %xmm4,%xmm1
- DB 15,40,223 ; movaps %xmm7,%xmm3
- DB 255,23 ; call *(%edi)
- DB 129,196,12,1,0,0 ; add $0x10c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 15,40,203 ; movaps %xmm3,%xmm1
+ DB 15,40,213 ; movaps %xmm5,%xmm2
+ DB 15,40,220 ; movaps %xmm4,%xmm3
+ DB 82 ; push %edx
+ DB 80 ; push %eax
+ DB 255,17 ; call *(%ecx)
+ DB 129,196,200,0,0,0 ; add $0xc8,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -38254,233 +37705,223 @@ PUBLIC _sk_hue_sse2
_sk_hue_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 129,236,236,0,0,0 ; sub $0xec,%esp
- DB 15,40,243 ; movaps %xmm3,%xmm6
- DB 15,41,85,216 ; movaps %xmm2,-0x28(%ebp)
- DB 15,40,85,40 ; movaps 0x28(%ebp),%xmm2
- DB 15,40,101,72 ; movaps 0x48(%ebp),%xmm4
- DB 15,40,109,56 ; movaps 0x38(%ebp),%xmm5
- DB 15,40,253 ; movaps %xmm5,%xmm7
- DB 15,95,252 ; maxps %xmm4,%xmm7
- DB 15,40,218 ; movaps %xmm2,%xmm3
- DB 15,95,223 ; maxps %xmm7,%xmm3
- DB 15,40,253 ; movaps %xmm5,%xmm7
- DB 15,93,252 ; minps %xmm4,%xmm7
+ DB 129,236,184,0,0,0 ; sub $0xb8,%esp
+ DB 15,40,251 ; movaps %xmm3,%xmm7
+ DB 15,41,85,232 ; movaps %xmm2,-0x18(%ebp)
+ DB 15,40,241 ; movaps %xmm1,%xmm6
+ DB 15,40,232 ; movaps %xmm0,%xmm5
+ DB 139,69,8 ; mov 0x8(%ebp),%eax
+ DB 15,40,72,16 ; movaps 0x10(%eax),%xmm1
+ DB 15,40,64,32 ; movaps 0x20(%eax),%xmm0
+ DB 15,41,69,136 ; movaps %xmm0,-0x78(%ebp)
+ DB 15,40,88,48 ; movaps 0x30(%eax),%xmm3
+ DB 15,41,93,200 ; movaps %xmm3,-0x38(%ebp)
+ DB 15,40,208 ; movaps %xmm0,%xmm2
+ DB 15,95,211 ; maxps %xmm3,%xmm2
+ DB 15,40,225 ; movaps %xmm1,%xmm4
+ DB 15,41,77,152 ; movaps %xmm1,-0x68(%ebp)
+ DB 15,95,226 ; maxps %xmm2,%xmm4
+ DB 15,93,195 ; minps %xmm3,%xmm0
+ DB 15,93,200 ; minps %xmm0,%xmm1
+ DB 15,92,225 ; subps %xmm1,%xmm4
+ DB 15,41,101,168 ; movaps %xmm4,-0x58(%ebp)
+ DB 232,0,0,0,0 ; call 1205 <_sk_hue_sse2+0x4f>
+ DB 89 ; pop %ecx
+ DB 15,40,221 ; movaps %xmm5,%xmm3
+ DB 15,40,197 ; movaps %xmm5,%xmm0
+ DB 15,89,223 ; mulps %xmm7,%xmm3
+ DB 15,40,214 ; movaps %xmm6,%xmm2
+ DB 15,89,215 ; mulps %xmm7,%xmm2
DB 15,40,226 ; movaps %xmm2,%xmm4
- DB 15,93,231 ; minps %xmm7,%xmm4
- DB 15,92,220 ; subps %xmm4,%xmm3
- DB 232,0,0,0,0 ; call 190d <_sk_hue_sse2+0x3f>
- DB 88 ; pop %eax
- DB 15,40,224 ; movaps %xmm0,%xmm4
- DB 15,89,230 ; mulps %xmm6,%xmm4
- DB 15,41,101,200 ; movaps %xmm4,-0x38(%ebp)
- DB 15,40,233 ; movaps %xmm1,%xmm5
- DB 15,89,238 ; mulps %xmm6,%xmm5
- DB 15,40,184,83,122,0,0 ; movaps 0x7a53(%eax),%xmm7
- DB 15,41,125,168 ; movaps %xmm7,-0x58(%ebp)
- DB 15,92,125,88 ; subps 0x58(%ebp),%xmm7
- DB 15,89,199 ; mulps %xmm7,%xmm0
- DB 15,41,133,104,255,255,255 ; movaps %xmm0,-0x98(%ebp)
- DB 15,89,207 ; mulps %xmm7,%xmm1
- DB 15,41,141,120,255,255,255 ; movaps %xmm1,-0x88(%ebp)
- DB 15,40,69,216 ; movaps -0x28(%ebp),%xmm0
- DB 15,89,248 ; mulps %xmm0,%xmm7
- DB 15,41,125,136 ; movaps %xmm7,-0x78(%ebp)
- DB 15,40,230 ; movaps %xmm6,%xmm4
- DB 15,41,101,184 ; movaps %xmm4,-0x48(%ebp)
- DB 15,89,196 ; mulps %xmm4,%xmm0
+ DB 15,40,72,64 ; movaps 0x40(%eax),%xmm1
+ DB 15,41,77,216 ; movaps %xmm1,-0x28(%ebp)
+ DB 15,40,169,123,94,0,0 ; movaps 0x5e7b(%ecx),%xmm5
+ DB 15,92,233 ; subps %xmm1,%xmm5
+ DB 15,89,197 ; mulps %xmm5,%xmm0
+ DB 15,41,133,72,255,255,255 ; movaps %xmm0,-0xb8(%ebp)
+ DB 15,89,245 ; mulps %xmm5,%xmm6
+ DB 15,41,181,104,255,255,255 ; movaps %xmm6,-0x98(%ebp)
+ DB 15,40,69,232 ; movaps -0x18(%ebp),%xmm0
+ DB 15,89,232 ; mulps %xmm0,%xmm5
+ DB 15,41,173,88,255,255,255 ; movaps %xmm5,-0xa8(%ebp)
+ DB 15,40,215 ; movaps %xmm7,%xmm2
+ DB 15,41,85,184 ; movaps %xmm2,-0x48(%ebp)
+ DB 15,89,194 ; mulps %xmm2,%xmm0
+ DB 15,40,236 ; movaps %xmm4,%xmm5
DB 15,40,205 ; movaps %xmm5,%xmm1
DB 15,93,200 ; minps %xmm0,%xmm1
- DB 15,40,117,200 ; movaps -0x38(%ebp),%xmm6
+ DB 15,40,243 ; movaps %xmm3,%xmm6
DB 15,40,254 ; movaps %xmm6,%xmm7
DB 15,93,249 ; minps %xmm1,%xmm7
DB 15,40,205 ; movaps %xmm5,%xmm1
DB 15,95,200 ; maxps %xmm0,%xmm1
- DB 15,40,214 ; movaps %xmm6,%xmm2
- DB 15,95,209 ; maxps %xmm1,%xmm2
- DB 15,92,215 ; subps %xmm7,%xmm2
+ DB 15,40,230 ; movaps %xmm6,%xmm4
+ DB 15,95,225 ; maxps %xmm1,%xmm4
+ DB 15,92,231 ; subps %xmm7,%xmm4
DB 15,92,247 ; subps %xmm7,%xmm6
DB 15,92,239 ; subps %xmm7,%xmm5
DB 15,92,199 ; subps %xmm7,%xmm0
- DB 15,89,220 ; mulps %xmm4,%xmm3
- DB 15,89,243 ; mulps %xmm3,%xmm6
- DB 15,89,235 ; mulps %xmm3,%xmm5
- DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,40,152,35,122,0,0 ; movaps 0x7a23(%eax),%xmm3
- DB 15,41,93,216 ; movaps %xmm3,-0x28(%ebp)
- DB 15,40,77,40 ; movaps 0x28(%ebp),%xmm1
+ DB 15,40,77,168 ; movaps -0x58(%ebp),%xmm1
+ DB 15,89,202 ; mulps %xmm2,%xmm1
+ DB 15,89,241 ; mulps %xmm1,%xmm6
+ DB 15,40,214 ; movaps %xmm6,%xmm2
+ DB 15,89,233 ; mulps %xmm1,%xmm5
+ DB 15,41,173,120,255,255,255 ; movaps %xmm5,-0x88(%ebp)
+ DB 15,89,193 ; mulps %xmm1,%xmm0
+ DB 15,40,153,75,94,0,0 ; movaps 0x5e4b(%ecx),%xmm3
+ DB 15,41,93,232 ; movaps %xmm3,-0x18(%ebp)
+ DB 15,40,117,152 ; movaps -0x68(%ebp),%xmm6
+ DB 15,40,206 ; movaps %xmm6,%xmm1
DB 15,89,203 ; mulps %xmm3,%xmm1
- DB 15,40,160,51,122,0,0 ; movaps 0x7a33(%eax),%xmm4
- DB 15,40,125,56 ; movaps 0x38(%ebp),%xmm7
- DB 15,89,252 ; mulps %xmm4,%xmm7
+ DB 15,40,153,91,94,0,0 ; movaps 0x5e5b(%ecx),%xmm3
+ DB 15,40,109,136 ; movaps -0x78(%ebp),%xmm5
+ DB 15,40,253 ; movaps %xmm5,%xmm7
+ DB 15,89,251 ; mulps %xmm3,%xmm7
DB 15,88,249 ; addps %xmm1,%xmm7
- DB 15,40,152,67,122,0,0 ; movaps 0x7a43(%eax),%xmm3
- DB 15,40,77,72 ; movaps 0x48(%ebp),%xmm1
- DB 15,89,203 ; mulps %xmm3,%xmm1
+ DB 15,40,137,123,94,0,0 ; movaps 0x5e7b(%ecx),%xmm1
+ DB 15,92,77,184 ; subps -0x48(%ebp),%xmm1
+ DB 15,89,241 ; mulps %xmm1,%xmm6
+ DB 15,41,117,152 ; movaps %xmm6,-0x68(%ebp)
+ DB 15,89,233 ; mulps %xmm1,%xmm5
+ DB 15,41,109,136 ; movaps %xmm5,-0x78(%ebp)
+ DB 15,40,241 ; movaps %xmm1,%xmm6
+ DB 15,40,77,200 ; movaps -0x38(%ebp),%xmm1
+ DB 15,89,241 ; mulps %xmm1,%xmm6
+ DB 15,41,117,168 ; movaps %xmm6,-0x58(%ebp)
+ DB 15,40,169,107,94,0,0 ; movaps 0x5e6b(%ecx),%xmm5
+ DB 15,89,205 ; mulps %xmm5,%xmm1
DB 15,88,207 ; addps %xmm7,%xmm1
- DB 15,94,242 ; divps %xmm2,%xmm6
- DB 15,40,253 ; movaps %xmm5,%xmm7
- DB 15,94,250 ; divps %xmm2,%xmm7
- DB 15,94,194 ; divps %xmm2,%xmm0
- DB 15,87,237 ; xorps %xmm5,%xmm5
- DB 15,194,213,4 ; cmpneqps %xmm5,%xmm2
- DB 15,84,242 ; andps %xmm2,%xmm6
- DB 15,84,250 ; andps %xmm2,%xmm7
- DB 15,40,239 ; movaps %xmm7,%xmm5
- DB 15,84,208 ; andps %xmm0,%xmm2
- DB 15,40,198 ; movaps %xmm6,%xmm0
- DB 15,89,69,216 ; mulps -0x28(%ebp),%xmm0
- DB 15,89,252 ; mulps %xmm4,%xmm7
- DB 15,88,248 ; addps %xmm0,%xmm7
+ DB 15,94,212 ; divps %xmm4,%xmm2
+ DB 15,40,181,120,255,255,255 ; movaps -0x88(%ebp),%xmm6
+ DB 15,94,244 ; divps %xmm4,%xmm6
+ DB 15,94,196 ; divps %xmm4,%xmm0
+ DB 15,87,255 ; xorps %xmm7,%xmm7
+ DB 15,194,231,4 ; cmpneqps %xmm7,%xmm4
+ DB 15,84,212 ; andps %xmm4,%xmm2
+ DB 15,84,244 ; andps %xmm4,%xmm6
+ DB 15,84,224 ; andps %xmm0,%xmm4
DB 15,40,194 ; movaps %xmm2,%xmm0
- DB 15,89,195 ; mulps %xmm3,%xmm0
+ DB 15,89,69,232 ; mulps -0x18(%ebp),%xmm0
+ DB 15,40,254 ; movaps %xmm6,%xmm7
+ DB 15,89,251 ; mulps %xmm3,%xmm7
+ DB 15,88,248 ; addps %xmm0,%xmm7
+ DB 15,40,196 ; movaps %xmm4,%xmm0
+ DB 15,89,197 ; mulps %xmm5,%xmm0
DB 15,88,199 ; addps %xmm7,%xmm0
DB 15,89,77,184 ; mulps -0x48(%ebp),%xmm1
DB 15,92,200 ; subps %xmm0,%xmm1
+ DB 15,88,209 ; addps %xmm1,%xmm2
DB 15,88,241 ; addps %xmm1,%xmm6
- DB 15,40,253 ; movaps %xmm5,%xmm7
- DB 15,88,249 ; addps %xmm1,%xmm7
- DB 15,88,202 ; addps %xmm2,%xmm1
- DB 15,40,199 ; movaps %xmm7,%xmm0
+ DB 15,88,204 ; addps %xmm4,%xmm1
+ DB 15,40,198 ; movaps %xmm6,%xmm0
DB 15,93,193 ; minps %xmm1,%xmm0
- DB 15,40,214 ; movaps %xmm6,%xmm2
- DB 15,93,208 ; minps %xmm0,%xmm2
- DB 15,40,199 ; movaps %xmm7,%xmm0
- DB 15,40,239 ; movaps %xmm7,%xmm5
- DB 15,41,109,200 ; movaps %xmm5,-0x38(%ebp)
+ DB 15,40,226 ; movaps %xmm2,%xmm4
+ DB 15,93,224 ; minps %xmm0,%xmm4
+ DB 15,40,198 ; movaps %xmm6,%xmm0
DB 15,95,193 ; maxps %xmm1,%xmm0
- DB 15,40,254 ; movaps %xmm6,%xmm7
+ DB 15,40,250 ; movaps %xmm2,%xmm7
DB 15,95,248 ; maxps %xmm0,%xmm7
- DB 15,40,69,216 ; movaps -0x28(%ebp),%xmm0
- DB 15,89,198 ; mulps %xmm6,%xmm0
- DB 15,89,229 ; mulps %xmm5,%xmm4
- DB 15,88,224 ; addps %xmm0,%xmm4
- DB 15,89,217 ; mulps %xmm1,%xmm3
- DB 15,88,220 ; addps %xmm4,%xmm3
+ DB 15,40,69,232 ; movaps -0x18(%ebp),%xmm0
+ DB 15,89,194 ; mulps %xmm2,%xmm0
+ DB 15,89,222 ; mulps %xmm6,%xmm3
+ DB 15,88,216 ; addps %xmm0,%xmm3
+ DB 15,89,233 ; mulps %xmm1,%xmm5
+ DB 15,88,235 ; addps %xmm3,%xmm5
DB 15,87,192 ; xorps %xmm0,%xmm0
- DB 15,194,194,2 ; cmpleps %xmm2,%xmm0
- DB 15,40,227 ; movaps %xmm3,%xmm4
- DB 15,92,226 ; subps %xmm2,%xmm4
- DB 15,41,101,216 ; movaps %xmm4,-0x28(%ebp)
- DB 15,40,214 ; movaps %xmm6,%xmm2
- DB 15,92,211 ; subps %xmm3,%xmm2
- DB 15,89,211 ; mulps %xmm3,%xmm2
- DB 15,94,212 ; divps %xmm4,%xmm2
- DB 15,88,211 ; addps %xmm3,%xmm2
- DB 15,40,232 ; movaps %xmm0,%xmm5
- DB 15,85,234 ; andnps %xmm2,%xmm5
- DB 15,84,240 ; andps %xmm0,%xmm6
- DB 15,86,245 ; orps %xmm5,%xmm6
- DB 15,40,109,184 ; movaps -0x48(%ebp),%xmm5
- DB 15,40,213 ; movaps %xmm5,%xmm2
- DB 15,40,101,88 ; movaps 0x58(%ebp),%xmm4
- DB 15,89,212 ; mulps %xmm4,%xmm2
- DB 15,40,101,168 ; movaps -0x58(%ebp),%xmm4
+ DB 15,194,196,2 ; cmpleps %xmm4,%xmm0
+ DB 15,40,221 ; movaps %xmm5,%xmm3
+ DB 15,92,220 ; subps %xmm4,%xmm3
+ DB 15,41,93,232 ; movaps %xmm3,-0x18(%ebp)
+ DB 15,40,226 ; movaps %xmm2,%xmm4
DB 15,92,229 ; subps %xmm5,%xmm4
- DB 15,41,101,168 ; movaps %xmm4,-0x58(%ebp)
- DB 15,88,109,88 ; addps 0x58(%ebp),%xmm5
- DB 15,92,234 ; subps %xmm2,%xmm5
- DB 15,41,109,184 ; movaps %xmm5,-0x48(%ebp)
- DB 15,40,234 ; movaps %xmm2,%xmm5
- DB 15,194,215,1 ; cmpltps %xmm7,%xmm2
+ DB 15,89,229 ; mulps %xmm5,%xmm4
+ DB 15,94,227 ; divps %xmm3,%xmm4
+ DB 15,88,229 ; addps %xmm5,%xmm4
+ DB 15,40,216 ; movaps %xmm0,%xmm3
+ DB 15,85,220 ; andnps %xmm4,%xmm3
DB 15,40,226 ; movaps %xmm2,%xmm4
- DB 15,85,230 ; andnps %xmm6,%xmm4
- DB 15,92,243 ; subps %xmm3,%xmm6
- DB 15,92,235 ; subps %xmm3,%xmm5
- DB 15,41,109,152 ; movaps %xmm5,-0x68(%ebp)
- DB 15,89,245 ; mulps %xmm5,%xmm6
- DB 15,92,251 ; subps %xmm3,%xmm7
- DB 15,94,247 ; divps %xmm7,%xmm6
- DB 15,88,243 ; addps %xmm3,%xmm6
- DB 15,84,242 ; andps %xmm2,%xmm6
- DB 15,86,244 ; orps %xmm4,%xmm6
- DB 15,40,101,200 ; movaps -0x38(%ebp),%xmm4
- DB 15,92,227 ; subps %xmm3,%xmm4
- DB 15,89,227 ; mulps %xmm3,%xmm4
- DB 15,94,101,216 ; divps -0x28(%ebp),%xmm4
- DB 15,88,227 ; addps %xmm3,%xmm4
- DB 15,40,232 ; movaps %xmm0,%xmm5
- DB 15,85,236 ; andnps %xmm4,%xmm5
- DB 15,40,101,200 ; movaps -0x38(%ebp),%xmm4
DB 15,84,224 ; andps %xmm0,%xmm4
- DB 15,86,229 ; orps %xmm5,%xmm4
- DB 15,40,234 ; movaps %xmm2,%xmm5
- DB 15,85,236 ; andnps %xmm4,%xmm5
- DB 15,92,227 ; subps %xmm3,%xmm4
- DB 15,89,101,152 ; mulps -0x68(%ebp),%xmm4
+ DB 15,86,227 ; orps %xmm3,%xmm4
+ DB 15,40,85,216 ; movaps -0x28(%ebp),%xmm2
+ DB 15,40,93,184 ; movaps -0x48(%ebp),%xmm3
+ DB 15,89,211 ; mulps %xmm3,%xmm2
+ DB 15,88,93,216 ; addps -0x28(%ebp),%xmm3
+ DB 15,92,218 ; subps %xmm2,%xmm3
+ DB 15,41,93,184 ; movaps %xmm3,-0x48(%ebp)
+ DB 15,41,85,216 ; movaps %xmm2,-0x28(%ebp)
+ DB 15,194,215,1 ; cmpltps %xmm7,%xmm2
+ DB 15,40,218 ; movaps %xmm2,%xmm3
+ DB 15,85,220 ; andnps %xmm4,%xmm3
+ DB 15,41,93,200 ; movaps %xmm3,-0x38(%ebp)
+ DB 15,92,229 ; subps %xmm5,%xmm4
+ DB 15,40,93,216 ; movaps -0x28(%ebp),%xmm3
+ DB 15,92,221 ; subps %xmm5,%xmm3
+ DB 15,41,93,216 ; movaps %xmm3,-0x28(%ebp)
+ DB 15,89,227 ; mulps %xmm3,%xmm4
+ DB 15,92,253 ; subps %xmm5,%xmm7
DB 15,94,231 ; divps %xmm7,%xmm4
- DB 15,88,227 ; addps %xmm3,%xmm4
+ DB 15,88,229 ; addps %xmm5,%xmm4
DB 15,84,226 ; andps %xmm2,%xmm4
- DB 15,86,229 ; orps %xmm5,%xmm4
- DB 15,40,236 ; movaps %xmm4,%xmm5
- DB 15,40,225 ; movaps %xmm1,%xmm4
- DB 15,92,227 ; subps %xmm3,%xmm4
- DB 15,89,227 ; mulps %xmm3,%xmm4
- DB 15,94,101,216 ; divps -0x28(%ebp),%xmm4
- DB 15,88,227 ; addps %xmm3,%xmm4
+ DB 15,86,101,200 ; orps -0x38(%ebp),%xmm4
+ DB 15,41,101,200 ; movaps %xmm4,-0x38(%ebp)
+ DB 15,40,222 ; movaps %xmm6,%xmm3
+ DB 15,92,221 ; subps %xmm5,%xmm3
+ DB 15,89,221 ; mulps %xmm5,%xmm3
+ DB 15,94,93,232 ; divps -0x18(%ebp),%xmm3
+ DB 15,88,221 ; addps %xmm5,%xmm3
+ DB 15,40,224 ; movaps %xmm0,%xmm4
+ DB 15,85,227 ; andnps %xmm3,%xmm4
+ DB 15,84,240 ; andps %xmm0,%xmm6
+ DB 15,86,244 ; orps %xmm4,%xmm6
+ DB 15,40,218 ; movaps %xmm2,%xmm3
+ DB 15,40,230 ; movaps %xmm6,%xmm4
+ DB 15,85,220 ; andnps %xmm4,%xmm3
+ DB 15,92,229 ; subps %xmm5,%xmm4
+ DB 15,40,117,216 ; movaps -0x28(%ebp),%xmm6
+ DB 15,89,230 ; mulps %xmm6,%xmm4
+ DB 15,94,231 ; divps %xmm7,%xmm4
+ DB 15,88,229 ; addps %xmm5,%xmm4
+ DB 15,84,226 ; andps %xmm2,%xmm4
+ DB 15,86,227 ; orps %xmm3,%xmm4
+ DB 15,40,217 ; movaps %xmm1,%xmm3
+ DB 15,92,221 ; subps %xmm5,%xmm3
+ DB 15,89,221 ; mulps %xmm5,%xmm3
+ DB 15,94,93,232 ; divps -0x18(%ebp),%xmm3
+ DB 15,88,221 ; addps %xmm5,%xmm3
DB 15,84,200 ; andps %xmm0,%xmm1
- DB 15,85,196 ; andnps %xmm4,%xmm0
+ DB 15,85,195 ; andnps %xmm3,%xmm0
DB 15,86,193 ; orps %xmm1,%xmm0
DB 15,40,202 ; movaps %xmm2,%xmm1
DB 15,85,200 ; andnps %xmm0,%xmm1
- DB 15,92,195 ; subps %xmm3,%xmm0
- DB 15,89,69,152 ; mulps -0x68(%ebp),%xmm0
+ DB 15,92,197 ; subps %xmm5,%xmm0
+ DB 15,89,198 ; mulps %xmm6,%xmm0
DB 15,94,199 ; divps %xmm7,%xmm0
- DB 15,88,195 ; addps %xmm3,%xmm0
+ DB 15,88,197 ; addps %xmm5,%xmm0
DB 15,84,194 ; andps %xmm2,%xmm0
DB 15,86,193 ; orps %xmm1,%xmm0
DB 15,87,201 ; xorps %xmm1,%xmm1
- DB 15,95,241 ; maxps %xmm1,%xmm6
- DB 15,95,233 ; maxps %xmm1,%xmm5
- DB 15,40,221 ; movaps %xmm5,%xmm3
+ DB 15,40,85,200 ; movaps -0x38(%ebp),%xmm2
+ DB 15,95,209 ; maxps %xmm1,%xmm2
+ DB 15,95,225 ; maxps %xmm1,%xmm4
DB 15,95,193 ; maxps %xmm1,%xmm0
- DB 15,40,125,168 ; movaps -0x58(%ebp),%xmm7
- DB 15,40,207 ; movaps %xmm7,%xmm1
- DB 15,40,109,40 ; movaps 0x28(%ebp),%xmm5
- DB 15,89,205 ; mulps %xmm5,%xmm1
- DB 15,40,173,104,255,255,255 ; movaps -0x98(%ebp),%xmm5
- DB 15,88,233 ; addps %xmm1,%xmm5
- DB 15,88,238 ; addps %xmm6,%xmm5
- DB 15,40,207 ; movaps %xmm7,%xmm1
- DB 15,40,101,56 ; movaps 0x38(%ebp),%xmm4
- DB 15,89,204 ; mulps %xmm4,%xmm1
- DB 15,40,149,120,255,255,255 ; movaps -0x88(%ebp),%xmm2
- DB 15,88,209 ; addps %xmm1,%xmm2
- DB 15,88,211 ; addps %xmm3,%xmm2
- DB 15,40,202 ; movaps %xmm2,%xmm1
- DB 15,40,85,72 ; movaps 0x48(%ebp),%xmm2
- DB 15,40,242 ; movaps %xmm2,%xmm6
- DB 15,89,254 ; mulps %xmm6,%xmm7
- DB 15,88,125,136 ; addps -0x78(%ebp),%xmm7
- DB 15,88,248 ; addps %xmm0,%xmm7
- DB 15,40,215 ; movaps %xmm7,%xmm2
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
- DB 139,85,20 ; mov 0x14(%ebp),%edx
- DB 139,117,24 ; mov 0x18(%ebp),%esi
- DB 139,125,12 ; mov 0xc(%ebp),%edi
- DB 141,95,4 ; lea 0x4(%edi),%ebx
- DB 15,40,69,88 ; movaps 0x58(%ebp),%xmm0
- DB 15,41,68,36,80 ; movaps %xmm0,0x50(%esp)
- DB 15,41,116,36,64 ; movaps %xmm6,0x40(%esp)
- DB 15,41,100,36,48 ; movaps %xmm4,0x30(%esp)
- DB 15,40,69,40 ; movaps 0x28(%ebp),%xmm0
- DB 15,41,68,36,32 ; movaps %xmm0,0x20(%esp)
- DB 137,116,36,16 ; mov %esi,0x10(%esp)
- DB 137,84,36,12 ; mov %edx,0xc(%esp)
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
- DB 15,40,197 ; movaps %xmm5,%xmm0
+ DB 15,40,157,72,255,255,255 ; movaps -0xb8(%ebp),%xmm3
+ DB 15,88,93,152 ; addps -0x68(%ebp),%xmm3
+ DB 15,88,218 ; addps %xmm2,%xmm3
+ DB 15,40,141,104,255,255,255 ; movaps -0x98(%ebp),%xmm1
+ DB 15,88,77,136 ; addps -0x78(%ebp),%xmm1
+ DB 15,88,204 ; addps %xmm4,%xmm1
+ DB 15,40,85,168 ; movaps -0x58(%ebp),%xmm2
+ DB 15,88,149,88,255,255,255 ; addps -0xa8(%ebp),%xmm2
+ DB 15,88,208 ; addps %xmm0,%xmm2
+ DB 139,77,12 ; mov 0xc(%ebp),%ecx
+ DB 141,81,4 ; lea 0x4(%ecx),%edx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 15,40,195 ; movaps %xmm3,%xmm0
DB 15,40,93,184 ; movaps -0x48(%ebp),%xmm3
- DB 255,23 ; call *(%edi)
- DB 129,196,236,0,0,0 ; add $0xec,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 82 ; push %edx
+ DB 80 ; push %eax
+ DB 255,17 ; call *(%ecx)
+ DB 129,196,200,0,0,0 ; add $0xc8,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -38488,225 +37929,216 @@ PUBLIC _sk_saturation_sse2
_sk_saturation_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 129,236,12,1,0,0 ; sub $0x10c,%esp
- DB 15,41,149,72,255,255,255 ; movaps %xmm2,-0xb8(%ebp)
- DB 15,41,141,88,255,255,255 ; movaps %xmm1,-0xa8(%ebp)
- DB 15,41,133,104,255,255,255 ; movaps %xmm0,-0x98(%ebp)
+ DB 129,236,216,0,0,0 ; sub $0xd8,%esp
+ DB 15,41,149,40,255,255,255 ; movaps %xmm2,-0xd8(%ebp)
+ DB 15,41,141,56,255,255,255 ; movaps %xmm1,-0xc8(%ebp)
+ DB 15,41,133,72,255,255,255 ; movaps %xmm0,-0xb8(%ebp)
+ DB 139,69,8 ; mov 0x8(%ebp),%eax
+ DB 15,40,112,16 ; movaps 0x10(%eax),%xmm6
+ DB 15,41,117,184 ; movaps %xmm6,-0x48(%ebp)
DB 15,40,225 ; movaps %xmm1,%xmm4
DB 15,95,226 ; maxps %xmm2,%xmm4
- DB 15,40,240 ; movaps %xmm0,%xmm6
- DB 15,95,244 ; maxps %xmm4,%xmm6
+ DB 15,40,232 ; movaps %xmm0,%xmm5
+ DB 15,95,236 ; maxps %xmm4,%xmm5
DB 15,40,225 ; movaps %xmm1,%xmm4
DB 15,93,226 ; minps %xmm2,%xmm4
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 15,93,212 ; minps %xmm4,%xmm2
- DB 15,40,77,40 ; movaps 0x28(%ebp),%xmm1
- DB 15,92,242 ; subps %xmm2,%xmm6
- DB 15,40,195 ; movaps %xmm3,%xmm0
- DB 15,41,69,216 ; movaps %xmm0,-0x28(%ebp)
- DB 15,40,232 ; movaps %xmm0,%xmm5
- DB 15,89,233 ; mulps %xmm1,%xmm5
- DB 15,89,93,56 ; mulps 0x38(%ebp),%xmm3
- DB 15,40,248 ; movaps %xmm0,%xmm7
- DB 15,89,125,72 ; mulps 0x48(%ebp),%xmm7
- DB 15,40,195 ; movaps %xmm3,%xmm0
- DB 15,93,199 ; minps %xmm7,%xmm0
- DB 15,40,213 ; movaps %xmm5,%xmm2
- DB 15,93,208 ; minps %xmm0,%xmm2
- DB 15,40,227 ; movaps %xmm3,%xmm4
- DB 15,95,231 ; maxps %xmm7,%xmm4
- DB 15,40,197 ; movaps %xmm5,%xmm0
- DB 15,95,196 ; maxps %xmm4,%xmm0
- DB 15,92,194 ; subps %xmm2,%xmm0
+ DB 15,40,64,32 ; movaps 0x20(%eax),%xmm0
DB 15,92,234 ; subps %xmm2,%xmm5
+ DB 15,40,214 ; movaps %xmm6,%xmm2
+ DB 15,41,93,216 ; movaps %xmm3,-0x28(%ebp)
+ DB 15,89,211 ; mulps %xmm3,%xmm2
+ DB 15,40,224 ; movaps %xmm0,%xmm4
+ DB 15,40,240 ; movaps %xmm0,%xmm6
+ DB 15,89,227 ; mulps %xmm3,%xmm4
+ DB 15,40,120,48 ; movaps 0x30(%eax),%xmm7
+ DB 15,41,125,200 ; movaps %xmm7,-0x38(%ebp)
+ DB 15,89,251 ; mulps %xmm3,%xmm7
+ DB 15,40,204 ; movaps %xmm4,%xmm1
+ DB 15,93,207 ; minps %xmm7,%xmm1
+ DB 15,40,194 ; movaps %xmm2,%xmm0
+ DB 15,93,209 ; minps %xmm1,%xmm2
+ DB 15,40,204 ; movaps %xmm4,%xmm1
+ DB 15,40,220 ; movaps %xmm4,%xmm3
+ DB 15,95,207 ; maxps %xmm7,%xmm1
+ DB 15,40,224 ; movaps %xmm0,%xmm4
+ DB 15,95,225 ; maxps %xmm1,%xmm4
+ DB 15,92,226 ; subps %xmm2,%xmm4
+ DB 15,92,194 ; subps %xmm2,%xmm0
+ DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,92,218 ; subps %xmm2,%xmm3
DB 15,92,250 ; subps %xmm2,%xmm7
- DB 15,89,117,88 ; mulps 0x58(%ebp),%xmm6
- DB 15,89,238 ; mulps %xmm6,%xmm5
- DB 15,89,222 ; mulps %xmm6,%xmm3
- DB 15,89,254 ; mulps %xmm6,%xmm7
- DB 232,0,0,0,0 ; call 1c5b <_sk_saturation_sse2+0x8e>
- DB 88 ; pop %eax
- DB 15,40,176,21,119,0,0 ; movaps 0x7715(%eax),%xmm6
- DB 15,40,209 ; movaps %xmm1,%xmm2
- DB 15,89,214 ; mulps %xmm6,%xmm2
- DB 15,40,160,37,119,0,0 ; movaps 0x7725(%eax),%xmm4
- DB 15,40,77,56 ; movaps 0x38(%ebp),%xmm1
- DB 15,89,204 ; mulps %xmm4,%xmm1
- DB 15,88,202 ; addps %xmm2,%xmm1
- DB 15,40,85,72 ; movaps 0x48(%ebp),%xmm2
- DB 15,89,144,53,119,0,0 ; mulps 0x7735(%eax),%xmm2
- DB 15,88,209 ; addps %xmm1,%xmm2
- DB 15,94,232 ; divps %xmm0,%xmm5
- DB 15,94,216 ; divps %xmm0,%xmm3
- DB 15,94,248 ; divps %xmm0,%xmm7
- DB 15,87,201 ; xorps %xmm1,%xmm1
- DB 15,194,193,4 ; cmpneqps %xmm1,%xmm0
- DB 15,84,232 ; andps %xmm0,%xmm5
- DB 15,84,216 ; andps %xmm0,%xmm3
- DB 15,84,199 ; andps %xmm7,%xmm0
- DB 15,40,205 ; movaps %xmm5,%xmm1
- DB 15,89,206 ; mulps %xmm6,%xmm1
- DB 15,40,251 ; movaps %xmm3,%xmm7
- DB 15,89,252 ; mulps %xmm4,%xmm7
- DB 15,88,249 ; addps %xmm1,%xmm7
+ DB 15,40,64,64 ; movaps 0x40(%eax),%xmm0
+ DB 15,41,69,152 ; movaps %xmm0,-0x68(%ebp)
+ DB 15,89,232 ; mulps %xmm0,%xmm5
+ DB 15,89,205 ; mulps %xmm5,%xmm1
+ DB 15,41,77,168 ; movaps %xmm1,-0x58(%ebp)
+ DB 15,89,221 ; mulps %xmm5,%xmm3
+ DB 15,40,211 ; movaps %xmm3,%xmm2
+ DB 15,89,253 ; mulps %xmm5,%xmm7
+ DB 232,0,0,0,0 ; call 1559 <_sk_saturation_sse2+0xb0>
+ DB 89 ; pop %ecx
+ DB 15,40,153,55,91,0,0 ; movaps 0x5b37(%ecx),%xmm3
+ DB 15,41,157,88,255,255,255 ; movaps %xmm3,-0xa8(%ebp)
+ DB 15,40,77,184 ; movaps -0x48(%ebp),%xmm1
+ DB 15,40,193 ; movaps %xmm1,%xmm0
+ DB 15,89,195 ; mulps %xmm3,%xmm0
+ DB 15,40,153,71,91,0,0 ; movaps 0x5b47(%ecx),%xmm3
+ DB 15,41,93,232 ; movaps %xmm3,-0x18(%ebp)
+ DB 15,40,238 ; movaps %xmm6,%xmm5
+ DB 15,89,235 ; mulps %xmm3,%xmm5
+ DB 15,88,232 ; addps %xmm0,%xmm5
+ DB 15,40,129,103,91,0,0 ; movaps 0x5b67(%ecx),%xmm0
+ DB 15,41,133,104,255,255,255 ; movaps %xmm0,-0x98(%ebp)
+ DB 15,92,69,216 ; subps -0x28(%ebp),%xmm0
+ DB 15,89,200 ; mulps %xmm0,%xmm1
+ DB 15,41,77,184 ; movaps %xmm1,-0x48(%ebp)
DB 15,40,200 ; movaps %xmm0,%xmm1
- DB 15,89,136,53,119,0,0 ; mulps 0x7735(%eax),%xmm1
- DB 15,88,207 ; addps %xmm7,%xmm1
- DB 15,89,85,216 ; mulps -0x28(%ebp),%xmm2
- DB 15,92,209 ; subps %xmm1,%xmm2
- DB 15,88,234 ; addps %xmm2,%xmm5
- DB 15,88,218 ; addps %xmm2,%xmm3
- DB 15,88,208 ; addps %xmm0,%xmm2
- DB 15,40,195 ; movaps %xmm3,%xmm0
- DB 15,93,194 ; minps %xmm2,%xmm0
- DB 15,40,205 ; movaps %xmm5,%xmm1
- DB 15,93,200 ; minps %xmm0,%xmm1
- DB 15,40,195 ; movaps %xmm3,%xmm0
- DB 15,95,194 ; maxps %xmm2,%xmm0
- DB 15,41,149,120,255,255,255 ; movaps %xmm2,-0x88(%ebp)
- DB 15,40,253 ; movaps %xmm5,%xmm7
- DB 15,95,248 ; maxps %xmm0,%xmm7
- DB 15,41,125,200 ; movaps %xmm7,-0x38(%ebp)
- DB 15,89,245 ; mulps %xmm5,%xmm6
- DB 15,89,227 ; mulps %xmm3,%xmm4
- DB 15,88,230 ; addps %xmm6,%xmm4
- DB 15,40,128,53,119,0,0 ; movaps 0x7735(%eax),%xmm0
- DB 15,89,194 ; mulps %xmm2,%xmm0
- DB 15,88,196 ; addps %xmm4,%xmm0
- DB 15,41,69,136 ; movaps %xmm0,-0x78(%ebp)
- DB 15,87,255 ; xorps %xmm7,%xmm7
- DB 15,194,249,2 ; cmpleps %xmm1,%xmm7
- DB 15,40,208 ; movaps %xmm0,%xmm2
- DB 15,92,209 ; subps %xmm1,%xmm2
- DB 15,41,85,184 ; movaps %xmm2,-0x48(%ebp)
- DB 15,40,205 ; movaps %xmm5,%xmm1
- DB 15,92,200 ; subps %xmm0,%xmm1
+ DB 15,89,241 ; mulps %xmm1,%xmm6
+ DB 15,41,117,136 ; movaps %xmm6,-0x78(%ebp)
+ DB 15,40,69,200 ; movaps -0x38(%ebp),%xmm0
DB 15,89,200 ; mulps %xmm0,%xmm1
- DB 15,94,202 ; divps %xmm2,%xmm1
- DB 15,88,200 ; addps %xmm0,%xmm1
- DB 15,40,199 ; movaps %xmm7,%xmm0
- DB 15,85,193 ; andnps %xmm1,%xmm0
- DB 15,84,239 ; andps %xmm7,%xmm5
- DB 15,86,232 ; orps %xmm0,%xmm5
- DB 15,40,69,216 ; movaps -0x28(%ebp),%xmm0
+ DB 15,41,141,120,255,255,255 ; movaps %xmm1,-0x88(%ebp)
DB 15,40,200 ; movaps %xmm0,%xmm1
- DB 15,40,224 ; movaps %xmm0,%xmm4
- DB 15,40,69,88 ; movaps 0x58(%ebp),%xmm0
+ DB 15,40,129,87,91,0,0 ; movaps 0x5b57(%ecx),%xmm0
DB 15,89,200 ; mulps %xmm0,%xmm1
- DB 15,40,144,69,119,0,0 ; movaps 0x7745(%eax),%xmm2
- DB 15,41,85,152 ; movaps %xmm2,-0x68(%ebp)
- DB 15,92,212 ; subps %xmm4,%xmm2
- DB 15,41,85,168 ; movaps %xmm2,-0x58(%ebp)
- DB 15,88,224 ; addps %xmm0,%xmm4
- DB 15,92,225 ; subps %xmm1,%xmm4
+ DB 15,88,205 ; addps %xmm5,%xmm1
+ DB 15,40,109,168 ; movaps -0x58(%ebp),%xmm5
+ DB 15,94,236 ; divps %xmm4,%xmm5
+ DB 15,94,212 ; divps %xmm4,%xmm2
+ DB 15,94,252 ; divps %xmm4,%xmm7
+ DB 15,87,219 ; xorps %xmm3,%xmm3
+ DB 15,194,227,4 ; cmpneqps %xmm3,%xmm4
+ DB 15,84,236 ; andps %xmm4,%xmm5
+ DB 15,84,212 ; andps %xmm4,%xmm2
+ DB 15,84,231 ; andps %xmm7,%xmm4
+ DB 15,40,220 ; movaps %xmm4,%xmm3
+ DB 15,40,245 ; movaps %xmm5,%xmm6
+ DB 15,40,165,88,255,255,255 ; movaps -0xa8(%ebp),%xmm4
+ DB 15,89,244 ; mulps %xmm4,%xmm6
+ DB 15,40,250 ; movaps %xmm2,%xmm7
+ DB 15,89,125,232 ; mulps -0x18(%ebp),%xmm7
+ DB 15,88,254 ; addps %xmm6,%xmm7
+ DB 15,40,243 ; movaps %xmm3,%xmm6
+ DB 15,89,240 ; mulps %xmm0,%xmm6
+ DB 15,88,247 ; addps %xmm7,%xmm6
+ DB 15,89,77,216 ; mulps -0x28(%ebp),%xmm1
+ DB 15,92,206 ; subps %xmm6,%xmm1
+ DB 15,88,233 ; addps %xmm1,%xmm5
+ DB 15,88,209 ; addps %xmm1,%xmm2
+ DB 15,41,85,200 ; movaps %xmm2,-0x38(%ebp)
+ DB 15,88,203 ; addps %xmm3,%xmm1
+ DB 15,40,218 ; movaps %xmm2,%xmm3
+ DB 15,93,217 ; minps %xmm1,%xmm3
+ DB 15,40,253 ; movaps %xmm5,%xmm7
+ DB 15,93,251 ; minps %xmm3,%xmm7
+ DB 15,40,218 ; movaps %xmm2,%xmm3
+ DB 15,95,217 ; maxps %xmm1,%xmm3
+ DB 15,40,245 ; movaps %xmm5,%xmm6
+ DB 15,95,243 ; maxps %xmm3,%xmm6
+ DB 15,89,229 ; mulps %xmm5,%xmm4
+ DB 15,40,93,232 ; movaps -0x18(%ebp),%xmm3
+ DB 15,89,218 ; mulps %xmm2,%xmm3
+ DB 15,88,220 ; addps %xmm4,%xmm3
+ DB 15,89,193 ; mulps %xmm1,%xmm0
+ DB 15,88,195 ; addps %xmm3,%xmm0
+ DB 15,87,219 ; xorps %xmm3,%xmm3
+ DB 15,194,223,2 ; cmpleps %xmm7,%xmm3
+ DB 15,40,208 ; movaps %xmm0,%xmm2
+ DB 15,92,215 ; subps %xmm7,%xmm2
+ DB 15,41,85,232 ; movaps %xmm2,-0x18(%ebp)
+ DB 15,40,253 ; movaps %xmm5,%xmm7
+ DB 15,92,248 ; subps %xmm0,%xmm7
+ DB 15,89,248 ; mulps %xmm0,%xmm7
+ DB 15,94,250 ; divps %xmm2,%xmm7
+ DB 15,88,248 ; addps %xmm0,%xmm7
+ DB 15,40,211 ; movaps %xmm3,%xmm2
+ DB 15,85,215 ; andnps %xmm7,%xmm2
+ DB 15,84,235 ; andps %xmm3,%xmm5
+ DB 15,86,234 ; orps %xmm2,%xmm5
+ DB 15,40,125,152 ; movaps -0x68(%ebp),%xmm7
+ DB 15,40,215 ; movaps %xmm7,%xmm2
+ DB 15,40,101,216 ; movaps -0x28(%ebp),%xmm4
+ DB 15,89,212 ; mulps %xmm4,%xmm2
+ DB 15,88,231 ; addps %xmm7,%xmm4
+ DB 15,92,226 ; subps %xmm2,%xmm4
DB 15,41,101,216 ; movaps %xmm4,-0x28(%ebp)
- DB 15,40,241 ; movaps %xmm1,%xmm6
- DB 15,40,209 ; movaps %xmm1,%xmm2
- DB 15,40,77,200 ; movaps -0x38(%ebp),%xmm1
- DB 15,194,209,1 ; cmpltps %xmm1,%xmm2
+ DB 15,40,250 ; movaps %xmm2,%xmm7
+ DB 15,194,214,1 ; cmpltps %xmm6,%xmm2
DB 15,40,226 ; movaps %xmm2,%xmm4
DB 15,85,229 ; andnps %xmm5,%xmm4
- DB 15,40,69,136 ; movaps -0x78(%ebp),%xmm0
DB 15,92,232 ; subps %xmm0,%xmm5
+ DB 15,92,248 ; subps %xmm0,%xmm7
+ DB 15,89,239 ; mulps %xmm7,%xmm5
DB 15,92,240 ; subps %xmm0,%xmm6
- DB 15,89,238 ; mulps %xmm6,%xmm5
- DB 15,92,200 ; subps %xmm0,%xmm1
- DB 15,41,77,200 ; movaps %xmm1,-0x38(%ebp)
- DB 15,94,233 ; divps %xmm1,%xmm5
+ DB 15,94,238 ; divps %xmm6,%xmm5
DB 15,88,232 ; addps %xmm0,%xmm5
DB 15,84,234 ; andps %xmm2,%xmm5
DB 15,86,236 ; orps %xmm4,%xmm5
- DB 15,40,203 ; movaps %xmm3,%xmm1
- DB 15,92,200 ; subps %xmm0,%xmm1
- DB 15,89,200 ; mulps %xmm0,%xmm1
- DB 15,94,77,184 ; divps -0x48(%ebp),%xmm1
- DB 15,88,200 ; addps %xmm0,%xmm1
- DB 15,40,231 ; movaps %xmm7,%xmm4
- DB 15,85,225 ; andnps %xmm1,%xmm4
- DB 15,84,223 ; andps %xmm7,%xmm3
- DB 15,86,220 ; orps %xmm4,%xmm3
+ DB 15,41,109,168 ; movaps %xmm5,-0x58(%ebp)
+ DB 15,40,101,200 ; movaps -0x38(%ebp),%xmm4
+ DB 15,92,224 ; subps %xmm0,%xmm4
+ DB 15,89,224 ; mulps %xmm0,%xmm4
+ DB 15,94,101,232 ; divps -0x18(%ebp),%xmm4
+ DB 15,88,224 ; addps %xmm0,%xmm4
+ DB 15,40,235 ; movaps %xmm3,%xmm5
+ DB 15,85,236 ; andnps %xmm4,%xmm5
+ DB 15,40,101,200 ; movaps -0x38(%ebp),%xmm4
+ DB 15,84,227 ; andps %xmm3,%xmm4
+ DB 15,86,229 ; orps %xmm5,%xmm4
+ DB 15,40,234 ; movaps %xmm2,%xmm5
+ DB 15,85,236 ; andnps %xmm4,%xmm5
+ DB 15,92,224 ; subps %xmm0,%xmm4
+ DB 15,89,231 ; mulps %xmm7,%xmm4
+ DB 15,94,230 ; divps %xmm6,%xmm4
+ DB 15,88,224 ; addps %xmm0,%xmm4
+ DB 15,84,226 ; andps %xmm2,%xmm4
+ DB 15,86,229 ; orps %xmm5,%xmm4
+ DB 15,40,236 ; movaps %xmm4,%xmm5
+ DB 15,40,225 ; movaps %xmm1,%xmm4
+ DB 15,92,224 ; subps %xmm0,%xmm4
+ DB 15,89,224 ; mulps %xmm0,%xmm4
+ DB 15,94,101,232 ; divps -0x18(%ebp),%xmm4
+ DB 15,88,224 ; addps %xmm0,%xmm4
+ DB 15,84,203 ; andps %xmm3,%xmm1
+ DB 15,85,220 ; andnps %xmm4,%xmm3
+ DB 15,86,217 ; orps %xmm1,%xmm3
DB 15,40,202 ; movaps %xmm2,%xmm1
DB 15,85,203 ; andnps %xmm3,%xmm1
DB 15,92,216 ; subps %xmm0,%xmm3
- DB 15,89,222 ; mulps %xmm6,%xmm3
- DB 15,94,93,200 ; divps -0x38(%ebp),%xmm3
+ DB 15,89,223 ; mulps %xmm7,%xmm3
+ DB 15,94,222 ; divps %xmm6,%xmm3
DB 15,88,216 ; addps %xmm0,%xmm3
DB 15,84,218 ; andps %xmm2,%xmm3
DB 15,86,217 ; orps %xmm1,%xmm3
- DB 15,40,165,120,255,255,255 ; movaps -0x88(%ebp),%xmm4
- DB 15,40,204 ; movaps %xmm4,%xmm1
- DB 15,92,200 ; subps %xmm0,%xmm1
- DB 15,89,200 ; mulps %xmm0,%xmm1
- DB 15,94,77,184 ; divps -0x48(%ebp),%xmm1
- DB 15,88,200 ; addps %xmm0,%xmm1
- DB 15,84,231 ; andps %xmm7,%xmm4
- DB 15,85,249 ; andnps %xmm1,%xmm7
- DB 15,86,252 ; orps %xmm4,%xmm7
- DB 15,40,202 ; movaps %xmm2,%xmm1
- DB 15,85,207 ; andnps %xmm7,%xmm1
- DB 15,92,248 ; subps %xmm0,%xmm7
- DB 15,89,254 ; mulps %xmm6,%xmm7
- DB 15,94,125,200 ; divps -0x38(%ebp),%xmm7
- DB 15,88,248 ; addps %xmm0,%xmm7
- DB 15,84,250 ; andps %xmm2,%xmm7
- DB 15,86,249 ; orps %xmm1,%xmm7
DB 15,87,192 ; xorps %xmm0,%xmm0
+ DB 15,40,77,168 ; movaps -0x58(%ebp),%xmm1
+ DB 15,95,200 ; maxps %xmm0,%xmm1
DB 15,95,232 ; maxps %xmm0,%xmm5
DB 15,95,216 ; maxps %xmm0,%xmm3
- DB 15,95,248 ; maxps %xmm0,%xmm7
- DB 15,40,69,88 ; movaps 0x58(%ebp),%xmm0
- DB 15,40,101,152 ; movaps -0x68(%ebp),%xmm4
- DB 15,92,224 ; subps %xmm0,%xmm4
- DB 15,40,141,104,255,255,255 ; movaps -0x98(%ebp),%xmm1
+ DB 15,40,165,104,255,255,255 ; movaps -0x98(%ebp),%xmm4
+ DB 15,92,101,152 ; subps -0x68(%ebp),%xmm4
+ DB 15,40,133,72,255,255,255 ; movaps -0xb8(%ebp),%xmm0
+ DB 15,89,196 ; mulps %xmm4,%xmm0
+ DB 15,88,69,184 ; addps -0x48(%ebp),%xmm0
+ DB 15,88,193 ; addps %xmm1,%xmm0
+ DB 15,40,141,56,255,255,255 ; movaps -0xc8(%ebp),%xmm1
DB 15,89,204 ; mulps %xmm4,%xmm1
- DB 15,40,85,168 ; movaps -0x58(%ebp),%xmm2
- DB 15,40,194 ; movaps %xmm2,%xmm0
- DB 15,40,117,40 ; movaps 0x28(%ebp),%xmm6
- DB 15,89,198 ; mulps %xmm6,%xmm0
- DB 15,88,200 ; addps %xmm0,%xmm1
+ DB 15,88,77,136 ; addps -0x78(%ebp),%xmm1
DB 15,88,205 ; addps %xmm5,%xmm1
- DB 15,40,241 ; movaps %xmm1,%xmm6
- DB 15,40,141,88,255,255,255 ; movaps -0xa8(%ebp),%xmm1
- DB 15,89,204 ; mulps %xmm4,%xmm1
- DB 15,40,196 ; movaps %xmm4,%xmm0
- DB 15,40,226 ; movaps %xmm2,%xmm4
- DB 15,40,109,56 ; movaps 0x38(%ebp),%xmm5
- DB 15,89,229 ; mulps %xmm5,%xmm4
- DB 15,88,204 ; addps %xmm4,%xmm1
- DB 15,88,203 ; addps %xmm3,%xmm1
- DB 15,89,133,72,255,255,255 ; mulps -0xb8(%ebp),%xmm0
- DB 15,40,93,72 ; movaps 0x48(%ebp),%xmm3
- DB 15,89,211 ; mulps %xmm3,%xmm2
- DB 15,88,208 ; addps %xmm0,%xmm2
- DB 15,88,215 ; addps %xmm7,%xmm2
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
- DB 139,85,20 ; mov 0x14(%ebp),%edx
- DB 139,117,24 ; mov 0x18(%ebp),%esi
- DB 139,125,12 ; mov 0xc(%ebp),%edi
- DB 141,95,4 ; lea 0x4(%edi),%ebx
- DB 15,40,69,88 ; movaps 0x58(%ebp),%xmm0
- DB 15,41,68,36,80 ; movaps %xmm0,0x50(%esp)
- DB 15,41,92,36,64 ; movaps %xmm3,0x40(%esp)
- DB 15,41,108,36,48 ; movaps %xmm5,0x30(%esp)
- DB 15,40,69,40 ; movaps 0x28(%ebp),%xmm0
- DB 15,41,68,36,32 ; movaps %xmm0,0x20(%esp)
- DB 137,116,36,16 ; mov %esi,0x10(%esp)
- DB 137,84,36,12 ; mov %edx,0xc(%esp)
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
- DB 15,40,198 ; movaps %xmm6,%xmm0
+ DB 15,89,165,40,255,255,255 ; mulps -0xd8(%ebp),%xmm4
+ DB 15,40,149,120,255,255,255 ; movaps -0x88(%ebp),%xmm2
+ DB 15,88,212 ; addps %xmm4,%xmm2
+ DB 15,88,211 ; addps %xmm3,%xmm2
+ DB 139,77,12 ; mov 0xc(%ebp),%ecx
+ DB 141,81,4 ; lea 0x4(%ecx),%edx
+ DB 131,236,8 ; sub $0x8,%esp
DB 15,40,93,216 ; movaps -0x28(%ebp),%xmm3
- DB 255,23 ; call *(%edi)
- DB 129,196,12,1,0,0 ; add $0x10c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 82 ; push %edx
+ DB 80 ; push %eax
+ DB 255,17 ; call *(%ecx)
+ DB 129,196,232,0,0,0 ; add $0xe8,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -38714,203 +38146,182 @@ PUBLIC _sk_color_sse2
_sk_color_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 129,236,28,1,0,0 ; sub $0x11c,%esp
+ DB 129,236,200,0,0,0 ; sub $0xc8,%esp
DB 15,41,93,200 ; movaps %xmm3,-0x38(%ebp)
- DB 15,41,149,72,255,255,255 ; movaps %xmm2,-0xb8(%ebp)
- DB 15,40,233 ; movaps %xmm1,%xmm5
- DB 232,0,0,0,0 ; call 1ee2 <_sk_color_sse2+0x1f>
- DB 88 ; pop %eax
- DB 15,40,85,56 ; movaps 0x38(%ebp),%xmm2
- DB 15,40,101,40 ; movaps 0x28(%ebp),%xmm4
- DB 15,40,152,206,116,0,0 ; movaps 0x74ce(%eax),%xmm3
- DB 15,89,227 ; mulps %xmm3,%xmm4
- DB 15,41,93,216 ; movaps %xmm3,-0x28(%ebp)
- DB 15,40,176,222,116,0,0 ; movaps 0x74de(%eax),%xmm6
- DB 15,89,214 ; mulps %xmm6,%xmm2
- DB 15,41,117,184 ; movaps %xmm6,-0x48(%ebp)
- DB 15,88,212 ; addps %xmm4,%xmm2
- DB 15,40,101,72 ; movaps 0x48(%ebp),%xmm4
- DB 15,40,184,238,116,0,0 ; movaps 0x74ee(%eax),%xmm7
- DB 15,41,189,56,255,255,255 ; movaps %xmm7,-0xc8(%ebp)
- DB 15,89,231 ; mulps %xmm7,%xmm4
- DB 15,88,226 ; addps %xmm2,%xmm4
- DB 15,41,101,136 ; movaps %xmm4,-0x78(%ebp)
- DB 15,40,85,88 ; movaps 0x58(%ebp),%xmm2
- DB 15,40,248 ; movaps %xmm0,%xmm7
- DB 15,89,250 ; mulps %xmm2,%xmm7
- DB 15,89,202 ; mulps %xmm2,%xmm1
- DB 15,41,77,152 ; movaps %xmm1,-0x68(%ebp)
- DB 15,40,231 ; movaps %xmm7,%xmm4
- DB 15,89,227 ; mulps %xmm3,%xmm4
- DB 15,40,209 ; movaps %xmm1,%xmm2
- DB 15,89,214 ; mulps %xmm6,%xmm2
- DB 15,88,212 ; addps %xmm4,%xmm2
- DB 15,40,136,254,116,0,0 ; movaps 0x74fe(%eax),%xmm1
- DB 15,41,77,168 ; movaps %xmm1,-0x58(%ebp)
+ DB 15,41,85,152 ; movaps %xmm2,-0x68(%ebp)
DB 15,40,225 ; movaps %xmm1,%xmm4
- DB 15,40,93,88 ; movaps 0x58(%ebp),%xmm3
- DB 15,92,227 ; subps %xmm3,%xmm4
- DB 15,89,196 ; mulps %xmm4,%xmm0
- DB 15,41,133,88,255,255,255 ; movaps %xmm0,-0xa8(%ebp)
- DB 15,89,236 ; mulps %xmm4,%xmm5
- DB 15,41,173,120,255,255,255 ; movaps %xmm5,-0x88(%ebp)
- DB 15,40,141,72,255,255,255 ; movaps -0xb8(%ebp),%xmm1
- DB 15,89,225 ; mulps %xmm1,%xmm4
DB 15,41,165,104,255,255,255 ; movaps %xmm4,-0x98(%ebp)
- DB 15,89,203 ; mulps %xmm3,%xmm1
- DB 15,40,193 ; movaps %xmm1,%xmm0
- DB 15,40,181,56,255,255,255 ; movaps -0xc8(%ebp),%xmm6
+ DB 15,40,232 ; movaps %xmm0,%xmm5
+ DB 15,41,173,120,255,255,255 ; movaps %xmm5,-0x88(%ebp)
+ DB 232,0,0,0,0 ; call 17b4 <_sk_color_sse2+0x2a>
+ DB 89 ; pop %ecx
+ DB 139,69,8 ; mov 0x8(%ebp),%eax
+ DB 15,40,80,16 ; movaps 0x10(%eax),%xmm2
+ DB 15,40,72,32 ; movaps 0x20(%eax),%xmm1
+ DB 15,40,177,28,89,0,0 ; movaps 0x591c(%ecx),%xmm6
+ DB 15,41,117,216 ; movaps %xmm6,-0x28(%ebp)
+ DB 15,40,194 ; movaps %xmm2,%xmm0
DB 15,89,198 ; mulps %xmm6,%xmm0
- DB 15,88,194 ; addps %xmm2,%xmm0
- DB 15,40,101,136 ; movaps -0x78(%ebp),%xmm4
- DB 15,89,101,200 ; mulps -0x38(%ebp),%xmm4
- DB 15,92,224 ; subps %xmm0,%xmm4
- DB 15,88,252 ; addps %xmm4,%xmm7
- DB 15,40,109,152 ; movaps -0x68(%ebp),%xmm5
- DB 15,88,236 ; addps %xmm4,%xmm5
- DB 15,88,225 ; addps %xmm1,%xmm4
- DB 15,40,197 ; movaps %xmm5,%xmm0
- DB 15,93,196 ; minps %xmm4,%xmm0
- DB 15,40,207 ; movaps %xmm7,%xmm1
- DB 15,93,200 ; minps %xmm0,%xmm1
- DB 15,40,197 ; movaps %xmm5,%xmm0
- DB 15,95,196 ; maxps %xmm4,%xmm0
- DB 15,41,101,136 ; movaps %xmm4,-0x78(%ebp)
- DB 15,40,223 ; movaps %xmm7,%xmm3
- DB 15,95,248 ; maxps %xmm0,%xmm7
- DB 15,40,69,216 ; movaps -0x28(%ebp),%xmm0
- DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,40,85,184 ; movaps -0x48(%ebp),%xmm2
+ DB 15,40,153,44,89,0,0 ; movaps 0x592c(%ecx),%xmm3
+ DB 15,41,93,184 ; movaps %xmm3,-0x48(%ebp)
+ DB 15,40,241 ; movaps %xmm1,%xmm6
+ DB 15,89,243 ; mulps %xmm3,%xmm6
+ DB 15,88,240 ; addps %xmm0,%xmm6
+ DB 15,40,129,76,89,0,0 ; movaps 0x594c(%ecx),%xmm0
+ DB 15,41,69,168 ; movaps %xmm0,-0x58(%ebp)
+ DB 15,92,69,200 ; subps -0x38(%ebp),%xmm0
+ DB 15,89,208 ; mulps %xmm0,%xmm2
+ DB 15,41,149,56,255,255,255 ; movaps %xmm2,-0xc8(%ebp)
+ DB 15,89,200 ; mulps %xmm0,%xmm1
+ DB 15,41,141,88,255,255,255 ; movaps %xmm1,-0xa8(%ebp)
+ DB 15,40,80,48 ; movaps 0x30(%eax),%xmm2
+ DB 15,89,194 ; mulps %xmm2,%xmm0
+ DB 15,41,133,72,255,255,255 ; movaps %xmm0,-0xb8(%ebp)
+ DB 15,40,137,60,89,0,0 ; movaps 0x593c(%ecx),%xmm1
+ DB 15,89,209 ; mulps %xmm1,%xmm2
+ DB 15,88,214 ; addps %xmm6,%xmm2
+ DB 15,40,88,64 ; movaps 0x40(%eax),%xmm3
+ DB 15,40,195 ; movaps %xmm3,%xmm0
+ DB 15,89,197 ; mulps %xmm5,%xmm0
+ DB 15,40,243 ; movaps %xmm3,%xmm6
+ DB 15,89,244 ; mulps %xmm4,%xmm6
+ DB 15,40,232 ; movaps %xmm0,%xmm5
+ DB 15,89,109,216 ; mulps -0x28(%ebp),%xmm5
+ DB 15,40,254 ; movaps %xmm6,%xmm7
+ DB 15,89,125,184 ; mulps -0x48(%ebp),%xmm7
+ DB 15,88,253 ; addps %xmm5,%xmm7
+ DB 15,40,109,168 ; movaps -0x58(%ebp),%xmm5
+ DB 15,92,235 ; subps %xmm3,%xmm5
+ DB 15,41,109,168 ; movaps %xmm5,-0x58(%ebp)
+ DB 15,40,109,200 ; movaps -0x38(%ebp),%xmm5
DB 15,89,213 ; mulps %xmm5,%xmm2
- DB 15,88,208 ; addps %xmm0,%xmm2
- DB 15,40,198 ; movaps %xmm6,%xmm0
- DB 15,89,196 ; mulps %xmm4,%xmm0
+ DB 15,41,93,232 ; movaps %xmm3,-0x18(%ebp)
+ DB 15,40,101,232 ; movaps -0x18(%ebp),%xmm4
+ DB 15,89,229 ; mulps %xmm5,%xmm4
+ DB 15,41,101,232 ; movaps %xmm4,-0x18(%ebp)
+ DB 15,88,235 ; addps %xmm3,%xmm5
+ DB 15,41,109,200 ; movaps %xmm5,-0x38(%ebp)
+ DB 15,40,235 ; movaps %xmm3,%xmm5
+ DB 15,89,109,152 ; mulps -0x68(%ebp),%xmm5
+ DB 15,40,221 ; movaps %xmm5,%xmm3
+ DB 15,89,217 ; mulps %xmm1,%xmm3
+ DB 15,88,223 ; addps %xmm7,%xmm3
+ DB 15,92,211 ; subps %xmm3,%xmm2
DB 15,88,194 ; addps %xmm2,%xmm0
- DB 15,87,246 ; xorps %xmm6,%xmm6
- DB 15,194,241,2 ; cmpleps %xmm1,%xmm6
- DB 15,40,208 ; movaps %xmm0,%xmm2
- DB 15,92,209 ; subps %xmm1,%xmm2
- DB 15,41,85,216 ; movaps %xmm2,-0x28(%ebp)
- DB 15,40,203 ; movaps %xmm3,%xmm1
- DB 15,92,200 ; subps %xmm0,%xmm1
- DB 15,89,200 ; mulps %xmm0,%xmm1
- DB 15,94,202 ; divps %xmm2,%xmm1
- DB 15,88,200 ; addps %xmm0,%xmm1
- DB 15,40,214 ; movaps %xmm6,%xmm2
- DB 15,85,209 ; andnps %xmm1,%xmm2
- DB 15,84,222 ; andps %xmm6,%xmm3
- DB 15,86,218 ; orps %xmm2,%xmm3
- DB 15,40,101,200 ; movaps -0x38(%ebp),%xmm4
- DB 15,40,204 ; movaps %xmm4,%xmm1
- DB 15,40,85,88 ; movaps 0x58(%ebp),%xmm2
+ DB 15,88,242 ; addps %xmm2,%xmm6
+ DB 15,88,213 ; addps %xmm5,%xmm2
+ DB 15,40,222 ; movaps %xmm6,%xmm3
+ DB 15,93,218 ; minps %xmm2,%xmm3
+ DB 15,40,224 ; movaps %xmm0,%xmm4
+ DB 15,93,227 ; minps %xmm3,%xmm4
+ DB 15,40,222 ; movaps %xmm6,%xmm3
+ DB 15,95,218 ; maxps %xmm2,%xmm3
+ DB 15,40,232 ; movaps %xmm0,%xmm5
+ DB 15,95,235 ; maxps %xmm3,%xmm5
+ DB 15,40,93,216 ; movaps -0x28(%ebp),%xmm3
+ DB 15,89,216 ; mulps %xmm0,%xmm3
+ DB 15,40,125,184 ; movaps -0x48(%ebp),%xmm7
+ DB 15,89,254 ; mulps %xmm6,%xmm7
+ DB 15,88,251 ; addps %xmm3,%xmm7
DB 15,89,202 ; mulps %xmm2,%xmm1
- DB 15,40,85,168 ; movaps -0x58(%ebp),%xmm2
- DB 15,92,212 ; subps %xmm4,%xmm2
- DB 15,41,85,168 ; movaps %xmm2,-0x58(%ebp)
- DB 15,88,101,88 ; addps 0x58(%ebp),%xmm4
+ DB 15,88,207 ; addps %xmm7,%xmm1
+ DB 15,87,255 ; xorps %xmm7,%xmm7
+ DB 15,194,252,2 ; cmpleps %xmm4,%xmm7
+ DB 15,40,217 ; movaps %xmm1,%xmm3
+ DB 15,92,220 ; subps %xmm4,%xmm3
+ DB 15,41,93,184 ; movaps %xmm3,-0x48(%ebp)
+ DB 15,40,224 ; movaps %xmm0,%xmm4
DB 15,92,225 ; subps %xmm1,%xmm4
- DB 15,41,101,200 ; movaps %xmm4,-0x38(%ebp)
- DB 15,40,209 ; movaps %xmm1,%xmm2
- DB 15,40,225 ; movaps %xmm1,%xmm4
- DB 15,194,231,1 ; cmpltps %xmm7,%xmm4
- DB 15,40,204 ; movaps %xmm4,%xmm1
- DB 15,85,203 ; andnps %xmm3,%xmm1
- DB 15,92,216 ; subps %xmm0,%xmm3
- DB 15,92,208 ; subps %xmm0,%xmm2
- DB 15,41,85,184 ; movaps %xmm2,-0x48(%ebp)
- DB 15,89,218 ; mulps %xmm2,%xmm3
- DB 15,92,248 ; subps %xmm0,%xmm7
- DB 15,94,223 ; divps %xmm7,%xmm3
- DB 15,88,216 ; addps %xmm0,%xmm3
- DB 15,84,220 ; andps %xmm4,%xmm3
- DB 15,86,217 ; orps %xmm1,%xmm3
- DB 15,40,205 ; movaps %xmm5,%xmm1
- DB 15,92,200 ; subps %xmm0,%xmm1
- DB 15,89,200 ; mulps %xmm0,%xmm1
- DB 15,94,77,216 ; divps -0x28(%ebp),%xmm1
- DB 15,88,200 ; addps %xmm0,%xmm1
- DB 15,40,214 ; movaps %xmm6,%xmm2
- DB 15,85,209 ; andnps %xmm1,%xmm2
- DB 15,84,238 ; andps %xmm6,%xmm5
- DB 15,86,234 ; orps %xmm2,%xmm5
- DB 15,40,204 ; movaps %xmm4,%xmm1
- DB 15,40,213 ; movaps %xmm5,%xmm2
- DB 15,85,202 ; andnps %xmm2,%xmm1
- DB 15,92,208 ; subps %xmm0,%xmm2
- DB 15,40,109,184 ; movaps -0x48(%ebp),%xmm5
- DB 15,89,213 ; mulps %xmm5,%xmm2
- DB 15,94,215 ; divps %xmm7,%xmm2
- DB 15,88,208 ; addps %xmm0,%xmm2
- DB 15,84,212 ; andps %xmm4,%xmm2
- DB 15,86,209 ; orps %xmm1,%xmm2
- DB 15,41,85,152 ; movaps %xmm2,-0x68(%ebp)
- DB 15,40,85,136 ; movaps -0x78(%ebp),%xmm2
- DB 15,40,202 ; movaps %xmm2,%xmm1
- DB 15,92,200 ; subps %xmm0,%xmm1
- DB 15,89,200 ; mulps %xmm0,%xmm1
- DB 15,94,77,216 ; divps -0x28(%ebp),%xmm1
- DB 15,88,200 ; addps %xmm0,%xmm1
- DB 15,84,214 ; andps %xmm6,%xmm2
- DB 15,85,241 ; andnps %xmm1,%xmm6
- DB 15,86,242 ; orps %xmm2,%xmm6
- DB 15,40,204 ; movaps %xmm4,%xmm1
- DB 15,85,206 ; andnps %xmm6,%xmm1
- DB 15,92,240 ; subps %xmm0,%xmm6
- DB 15,89,245 ; mulps %xmm5,%xmm6
- DB 15,94,247 ; divps %xmm7,%xmm6
- DB 15,88,240 ; addps %xmm0,%xmm6
+ DB 15,89,225 ; mulps %xmm1,%xmm4
+ DB 15,94,227 ; divps %xmm3,%xmm4
+ DB 15,88,225 ; addps %xmm1,%xmm4
+ DB 15,40,223 ; movaps %xmm7,%xmm3
+ DB 15,85,220 ; andnps %xmm4,%xmm3
+ DB 15,84,199 ; andps %xmm7,%xmm0
+ DB 15,86,195 ; orps %xmm3,%xmm0
+ DB 15,40,93,200 ; movaps -0x38(%ebp),%xmm3
+ DB 15,40,101,232 ; movaps -0x18(%ebp),%xmm4
+ DB 15,92,220 ; subps %xmm4,%xmm3
+ DB 15,41,93,200 ; movaps %xmm3,-0x38(%ebp)
+ DB 15,41,101,216 ; movaps %xmm4,-0x28(%ebp)
+ DB 15,194,229,1 ; cmpltps %xmm5,%xmm4
+ DB 15,40,220 ; movaps %xmm4,%xmm3
+ DB 15,85,216 ; andnps %xmm0,%xmm3
+ DB 15,41,93,232 ; movaps %xmm3,-0x18(%ebp)
+ DB 15,92,193 ; subps %xmm1,%xmm0
+ DB 15,40,93,216 ; movaps -0x28(%ebp),%xmm3
+ DB 15,92,217 ; subps %xmm1,%xmm3
+ DB 15,41,93,216 ; movaps %xmm3,-0x28(%ebp)
+ DB 15,89,195 ; mulps %xmm3,%xmm0
+ DB 15,92,233 ; subps %xmm1,%xmm5
+ DB 15,41,109,136 ; movaps %xmm5,-0x78(%ebp)
+ DB 15,94,197 ; divps %xmm5,%xmm0
+ DB 15,88,193 ; addps %xmm1,%xmm0
+ DB 15,84,196 ; andps %xmm4,%xmm0
+ DB 15,86,69,232 ; orps -0x18(%ebp),%xmm0
+ DB 15,40,222 ; movaps %xmm6,%xmm3
+ DB 15,92,217 ; subps %xmm1,%xmm3
+ DB 15,89,217 ; mulps %xmm1,%xmm3
+ DB 15,94,93,184 ; divps -0x48(%ebp),%xmm3
+ DB 15,88,217 ; addps %xmm1,%xmm3
+ DB 15,41,125,232 ; movaps %xmm7,-0x18(%ebp)
+ DB 15,40,109,232 ; movaps -0x18(%ebp),%xmm5
+ DB 15,85,235 ; andnps %xmm3,%xmm5
+ DB 15,41,109,232 ; movaps %xmm5,-0x18(%ebp)
+ DB 15,84,247 ; andps %xmm7,%xmm6
+ DB 15,86,117,232 ; orps -0x18(%ebp),%xmm6
+ DB 15,40,220 ; movaps %xmm4,%xmm3
+ DB 15,85,222 ; andnps %xmm6,%xmm3
+ DB 15,92,241 ; subps %xmm1,%xmm6
+ DB 15,89,117,216 ; mulps -0x28(%ebp),%xmm6
+ DB 15,40,109,136 ; movaps -0x78(%ebp),%xmm5
+ DB 15,94,245 ; divps %xmm5,%xmm6
+ DB 15,88,241 ; addps %xmm1,%xmm6
DB 15,84,244 ; andps %xmm4,%xmm6
- DB 15,86,241 ; orps %xmm1,%xmm6
- DB 15,87,192 ; xorps %xmm0,%xmm0
- DB 15,95,216 ; maxps %xmm0,%xmm3
- DB 15,40,101,152 ; movaps -0x68(%ebp),%xmm4
- DB 15,95,224 ; maxps %xmm0,%xmm4
- DB 15,95,240 ; maxps %xmm0,%xmm6
- DB 15,40,109,168 ; movaps -0x58(%ebp),%xmm5
- DB 15,40,197 ; movaps %xmm5,%xmm0
- DB 15,40,125,40 ; movaps 0x28(%ebp),%xmm7
- DB 15,89,199 ; mulps %xmm7,%xmm0
- DB 15,40,141,88,255,255,255 ; movaps -0xa8(%ebp),%xmm1
+ DB 15,86,243 ; orps %xmm3,%xmm6
+ DB 15,40,218 ; movaps %xmm2,%xmm3
+ DB 15,92,217 ; subps %xmm1,%xmm3
+ DB 15,89,217 ; mulps %xmm1,%xmm3
+ DB 15,94,93,184 ; divps -0x48(%ebp),%xmm3
+ DB 15,88,217 ; addps %xmm1,%xmm3
+ DB 15,84,215 ; andps %xmm7,%xmm2
+ DB 15,85,251 ; andnps %xmm3,%xmm7
+ DB 15,86,250 ; orps %xmm2,%xmm7
+ DB 15,40,212 ; movaps %xmm4,%xmm2
+ DB 15,85,215 ; andnps %xmm7,%xmm2
+ DB 15,92,249 ; subps %xmm1,%xmm7
+ DB 15,89,125,216 ; mulps -0x28(%ebp),%xmm7
+ DB 15,94,253 ; divps %xmm5,%xmm7
+ DB 15,88,249 ; addps %xmm1,%xmm7
+ DB 15,84,252 ; andps %xmm4,%xmm7
+ DB 15,86,250 ; orps %xmm2,%xmm7
+ DB 15,87,201 ; xorps %xmm1,%xmm1
+ DB 15,95,193 ; maxps %xmm1,%xmm0
+ DB 15,95,241 ; maxps %xmm1,%xmm6
+ DB 15,95,249 ; maxps %xmm1,%xmm7
+ DB 15,40,141,120,255,255,255 ; movaps -0x88(%ebp),%xmm1
+ DB 15,40,85,168 ; movaps -0x58(%ebp),%xmm2
+ DB 15,89,202 ; mulps %xmm2,%xmm1
+ DB 15,88,141,56,255,255,255 ; addps -0xc8(%ebp),%xmm1
DB 15,88,200 ; addps %xmm0,%xmm1
- DB 15,88,203 ; addps %xmm3,%xmm1
DB 15,40,193 ; movaps %xmm1,%xmm0
- DB 15,40,213 ; movaps %xmm5,%xmm2
- DB 15,40,93,56 ; movaps 0x38(%ebp),%xmm3
+ DB 15,40,141,104,255,255,255 ; movaps -0x98(%ebp),%xmm1
+ DB 15,89,202 ; mulps %xmm2,%xmm1
+ DB 15,40,218 ; movaps %xmm2,%xmm3
+ DB 15,88,141,88,255,255,255 ; addps -0xa8(%ebp),%xmm1
+ DB 15,88,206 ; addps %xmm6,%xmm1
+ DB 15,40,85,152 ; movaps -0x68(%ebp),%xmm2
DB 15,89,211 ; mulps %xmm3,%xmm2
- DB 15,40,141,120,255,255,255 ; movaps -0x88(%ebp),%xmm1
- DB 15,88,202 ; addps %xmm2,%xmm1
- DB 15,88,204 ; addps %xmm4,%xmm1
- DB 15,40,85,72 ; movaps 0x48(%ebp),%xmm2
- DB 15,40,226 ; movaps %xmm2,%xmm4
- DB 15,89,236 ; mulps %xmm4,%xmm5
- DB 15,88,173,104,255,255,255 ; addps -0x98(%ebp),%xmm5
- DB 15,88,238 ; addps %xmm6,%xmm5
- DB 15,40,213 ; movaps %xmm5,%xmm2
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
- DB 139,85,20 ; mov 0x14(%ebp),%edx
- DB 139,117,24 ; mov 0x18(%ebp),%esi
- DB 139,125,12 ; mov 0xc(%ebp),%edi
- DB 141,95,4 ; lea 0x4(%edi),%ebx
- DB 15,40,109,88 ; movaps 0x58(%ebp),%xmm5
- DB 15,41,108,36,80 ; movaps %xmm5,0x50(%esp)
- DB 15,41,100,36,64 ; movaps %xmm4,0x40(%esp)
- DB 15,41,92,36,48 ; movaps %xmm3,0x30(%esp)
- DB 15,41,124,36,32 ; movaps %xmm7,0x20(%esp)
- DB 137,116,36,16 ; mov %esi,0x10(%esp)
- DB 137,84,36,12 ; mov %edx,0xc(%esp)
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
+ DB 15,88,149,72,255,255,255 ; addps -0xb8(%ebp),%xmm2
+ DB 15,88,215 ; addps %xmm7,%xmm2
+ DB 139,77,12 ; mov 0xc(%ebp),%ecx
+ DB 141,81,4 ; lea 0x4(%ecx),%edx
+ DB 131,236,8 ; sub $0x8,%esp
DB 15,40,93,200 ; movaps -0x38(%ebp),%xmm3
- DB 255,23 ; call *(%edi)
- DB 129,196,28,1,0,0 ; add $0x11c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 82 ; push %edx
+ DB 80 ; push %eax
+ DB 255,17 ; call *(%ecx)
+ DB 129,196,216,0,0,0 ; add $0xd8,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -38918,194 +38329,179 @@ PUBLIC _sk_luminosity_sse2
_sk_luminosity_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 129,236,252,0,0,0 ; sub $0xfc,%esp
- DB 15,40,243 ; movaps %xmm3,%xmm6
- DB 15,40,234 ; movaps %xmm2,%xmm5
- DB 15,40,216 ; movaps %xmm0,%xmm3
- DB 232,0,0,0,0 ; call 2195 <_sk_luminosity_sse2+0x1a>
- DB 88 ; pop %eax
- DB 15,40,160,91,114,0,0 ; movaps 0x725b(%eax),%xmm4
- DB 15,41,101,216 ; movaps %xmm4,-0x28(%ebp)
- DB 15,40,211 ; movaps %xmm3,%xmm2
+ DB 129,236,184,0,0,0 ; sub $0xb8,%esp
+ DB 15,40,242 ; movaps %xmm2,%xmm6
+ DB 232,0,0,0,0 ; call 1a17 <_sk_luminosity_sse2+0x11>
+ DB 89 ; pop %ecx
+ DB 139,69,8 ; mov 0x8(%ebp),%eax
+ DB 15,40,161,249,86,0,0 ; movaps 0x56f9(%ecx),%xmm4
+ DB 15,41,101,232 ; movaps %xmm4,-0x18(%ebp)
+ DB 15,40,208 ; movaps %xmm0,%xmm2
DB 15,89,212 ; mulps %xmm4,%xmm2
- DB 15,40,128,107,114,0,0 ; movaps 0x726b(%eax),%xmm0
- DB 15,41,69,200 ; movaps %xmm0,-0x38(%ebp)
- DB 15,40,225 ; movaps %xmm1,%xmm4
- DB 15,89,224 ; mulps %xmm0,%xmm4
- DB 15,88,226 ; addps %xmm2,%xmm4
- DB 15,40,85,88 ; movaps 0x58(%ebp),%xmm2
- DB 15,40,184,139,114,0,0 ; movaps 0x728b(%eax),%xmm7
- DB 15,41,125,152 ; movaps %xmm7,-0x68(%ebp)
+ DB 15,40,161,9,87,0,0 ; movaps 0x5709(%ecx),%xmm4
+ DB 15,41,101,216 ; movaps %xmm4,-0x28(%ebp)
+ DB 15,40,233 ; movaps %xmm1,%xmm5
+ DB 15,89,236 ; mulps %xmm4,%xmm5
+ DB 15,88,234 ; addps %xmm2,%xmm5
+ DB 15,40,80,64 ; movaps 0x40(%eax),%xmm2
+ DB 15,41,85,184 ; movaps %xmm2,-0x48(%ebp)
+ DB 15,40,161,41,87,0,0 ; movaps 0x5729(%ecx),%xmm4
+ DB 15,40,252 ; movaps %xmm4,%xmm7
DB 15,92,250 ; subps %xmm2,%xmm7
- DB 15,89,223 ; mulps %xmm7,%xmm3
- DB 15,41,157,88,255,255,255 ; movaps %xmm3,-0xa8(%ebp)
+ DB 15,89,199 ; mulps %xmm7,%xmm0
+ DB 15,41,133,72,255,255,255 ; movaps %xmm0,-0xb8(%ebp)
DB 15,89,207 ; mulps %xmm7,%xmm1
- DB 15,41,141,104,255,255,255 ; movaps %xmm1,-0x98(%ebp)
- DB 15,89,253 ; mulps %xmm5,%xmm7
- DB 15,41,189,120,255,255,255 ; movaps %xmm7,-0x88(%ebp)
- DB 15,40,205 ; movaps %xmm5,%xmm1
- DB 15,40,128,123,114,0,0 ; movaps 0x727b(%eax),%xmm0
- DB 15,89,200 ; mulps %xmm0,%xmm1
- DB 15,88,204 ; addps %xmm4,%xmm1
- DB 15,40,238 ; movaps %xmm6,%xmm5
- DB 15,89,109,40 ; mulps 0x28(%ebp),%xmm5
- DB 15,40,222 ; movaps %xmm6,%xmm3
- DB 15,41,117,168 ; movaps %xmm6,-0x58(%ebp)
- DB 15,89,93,56 ; mulps 0x38(%ebp),%xmm3
- DB 15,40,229 ; movaps %xmm5,%xmm4
- DB 15,89,101,216 ; mulps -0x28(%ebp),%xmm4
- DB 15,40,211 ; movaps %xmm3,%xmm2
- DB 15,89,85,200 ; mulps -0x38(%ebp),%xmm2
- DB 15,88,212 ; addps %xmm4,%xmm2
- DB 15,89,117,72 ; mulps 0x48(%ebp),%xmm6
- DB 15,40,230 ; movaps %xmm6,%xmm4
- DB 15,89,224 ; mulps %xmm0,%xmm4
- DB 15,88,226 ; addps %xmm2,%xmm4
- DB 15,40,85,88 ; movaps 0x58(%ebp),%xmm2
- DB 15,89,202 ; mulps %xmm2,%xmm1
- DB 15,92,204 ; subps %xmm4,%xmm1
- DB 15,88,233 ; addps %xmm1,%xmm5
- DB 15,88,217 ; addps %xmm1,%xmm3
- DB 15,88,206 ; addps %xmm6,%xmm1
- DB 15,40,211 ; movaps %xmm3,%xmm2
- DB 15,93,209 ; minps %xmm1,%xmm2
- DB 15,40,229 ; movaps %xmm5,%xmm4
- DB 15,93,226 ; minps %xmm2,%xmm4
- DB 15,40,243 ; movaps %xmm3,%xmm6
- DB 15,95,241 ; maxps %xmm1,%xmm6
- DB 15,40,213 ; movaps %xmm5,%xmm2
- DB 15,95,214 ; maxps %xmm6,%xmm2
- DB 15,41,85,184 ; movaps %xmm2,-0x48(%ebp)
- DB 15,40,85,216 ; movaps -0x28(%ebp),%xmm2
- DB 15,89,213 ; mulps %xmm5,%xmm2
- DB 15,40,117,200 ; movaps -0x38(%ebp),%xmm6
+ DB 15,41,141,88,255,255,255 ; movaps %xmm1,-0xa8(%ebp)
+ DB 15,89,254 ; mulps %xmm6,%xmm7
+ DB 15,41,189,104,255,255,255 ; movaps %xmm7,-0x98(%ebp)
+ DB 15,40,214 ; movaps %xmm6,%xmm2
+ DB 15,40,137,25,87,0,0 ; movaps 0x5719(%ecx),%xmm1
+ DB 15,89,209 ; mulps %xmm1,%xmm2
+ DB 15,88,213 ; addps %xmm5,%xmm2
+ DB 15,40,104,16 ; movaps 0x10(%eax),%xmm5
+ DB 15,41,109,136 ; movaps %xmm5,-0x78(%ebp)
+ DB 15,89,235 ; mulps %xmm3,%xmm5
+ DB 15,40,112,32 ; movaps 0x20(%eax),%xmm6
+ DB 15,41,117,152 ; movaps %xmm6,-0x68(%ebp)
DB 15,89,243 ; mulps %xmm3,%xmm6
- DB 15,88,242 ; addps %xmm2,%xmm6
+ DB 15,40,197 ; movaps %xmm5,%xmm0
+ DB 15,89,69,232 ; mulps -0x18(%ebp),%xmm0
+ DB 15,40,254 ; movaps %xmm6,%xmm7
+ DB 15,89,125,216 ; mulps -0x28(%ebp),%xmm7
+ DB 15,88,248 ; addps %xmm0,%xmm7
+ DB 15,92,227 ; subps %xmm3,%xmm4
+ DB 15,41,93,168 ; movaps %xmm3,-0x58(%ebp)
+ DB 15,40,69,136 ; movaps -0x78(%ebp),%xmm0
+ DB 15,89,196 ; mulps %xmm4,%xmm0
+ DB 15,41,69,136 ; movaps %xmm0,-0x78(%ebp)
+ DB 15,40,69,152 ; movaps -0x68(%ebp),%xmm0
+ DB 15,89,196 ; mulps %xmm4,%xmm0
+ DB 15,41,69,152 ; movaps %xmm0,-0x68(%ebp)
+ DB 15,40,64,48 ; movaps 0x30(%eax),%xmm0
+ DB 15,89,224 ; mulps %xmm0,%xmm4
+ DB 15,41,165,120,255,255,255 ; movaps %xmm4,-0x88(%ebp)
+ DB 15,40,224 ; movaps %xmm0,%xmm4
+ DB 15,89,227 ; mulps %xmm3,%xmm4
+ DB 15,40,196 ; movaps %xmm4,%xmm0
DB 15,89,193 ; mulps %xmm1,%xmm0
- DB 15,88,198 ; addps %xmm6,%xmm0
- DB 15,87,255 ; xorps %xmm7,%xmm7
- DB 15,194,252,2 ; cmpleps %xmm4,%xmm7
- DB 15,40,208 ; movaps %xmm0,%xmm2
- DB 15,92,212 ; subps %xmm4,%xmm2
- DB 15,41,85,200 ; movaps %xmm2,-0x38(%ebp)
+ DB 15,88,199 ; addps %xmm7,%xmm0
+ DB 15,40,93,184 ; movaps -0x48(%ebp),%xmm3
+ DB 15,89,211 ; mulps %xmm3,%xmm2
+ DB 15,92,208 ; subps %xmm0,%xmm2
+ DB 15,88,234 ; addps %xmm2,%xmm5
+ DB 15,88,242 ; addps %xmm2,%xmm6
+ DB 15,88,212 ; addps %xmm4,%xmm2
+ DB 15,40,198 ; movaps %xmm6,%xmm0
+ DB 15,93,194 ; minps %xmm2,%xmm0
DB 15,40,229 ; movaps %xmm5,%xmm4
- DB 15,92,224 ; subps %xmm0,%xmm4
- DB 15,89,224 ; mulps %xmm0,%xmm4
- DB 15,94,226 ; divps %xmm2,%xmm4
- DB 15,88,224 ; addps %xmm0,%xmm4
- DB 15,40,215 ; movaps %xmm7,%xmm2
- DB 15,85,212 ; andnps %xmm4,%xmm2
- DB 15,84,239 ; andps %xmm7,%xmm5
- DB 15,86,234 ; orps %xmm2,%xmm5
- DB 15,40,101,168 ; movaps -0x58(%ebp),%xmm4
- DB 15,40,212 ; movaps %xmm4,%xmm2
- DB 15,40,117,88 ; movaps 0x58(%ebp),%xmm6
- DB 15,89,214 ; mulps %xmm6,%xmm2
- DB 15,40,117,152 ; movaps -0x68(%ebp),%xmm6
- DB 15,92,244 ; subps %xmm4,%xmm6
- DB 15,41,117,152 ; movaps %xmm6,-0x68(%ebp)
- DB 15,88,101,88 ; addps 0x58(%ebp),%xmm4
- DB 15,92,226 ; subps %xmm2,%xmm4
- DB 15,41,101,168 ; movaps %xmm4,-0x58(%ebp)
- DB 15,41,85,216 ; movaps %xmm2,-0x28(%ebp)
- DB 15,40,117,184 ; movaps -0x48(%ebp),%xmm6
- DB 15,194,214,1 ; cmpltps %xmm6,%xmm2
- DB 15,40,226 ; movaps %xmm2,%xmm4
+ DB 15,93,224 ; minps %xmm0,%xmm4
+ DB 15,40,198 ; movaps %xmm6,%xmm0
+ DB 15,95,194 ; maxps %xmm2,%xmm0
+ DB 15,40,253 ; movaps %xmm5,%xmm7
+ DB 15,95,248 ; maxps %xmm0,%xmm7
+ DB 15,41,125,200 ; movaps %xmm7,-0x38(%ebp)
+ DB 15,40,69,232 ; movaps -0x18(%ebp),%xmm0
+ DB 15,89,197 ; mulps %xmm5,%xmm0
+ DB 15,40,125,216 ; movaps -0x28(%ebp),%xmm7
+ DB 15,89,254 ; mulps %xmm6,%xmm7
+ DB 15,88,248 ; addps %xmm0,%xmm7
+ DB 15,89,202 ; mulps %xmm2,%xmm1
+ DB 15,88,207 ; addps %xmm7,%xmm1
+ DB 15,87,192 ; xorps %xmm0,%xmm0
+ DB 15,194,196,2 ; cmpleps %xmm4,%xmm0
+ DB 15,40,249 ; movaps %xmm1,%xmm7
+ DB 15,92,252 ; subps %xmm4,%xmm7
+ DB 15,41,125,216 ; movaps %xmm7,-0x28(%ebp)
+ DB 15,40,229 ; movaps %xmm5,%xmm4
+ DB 15,92,225 ; subps %xmm1,%xmm4
+ DB 15,89,225 ; mulps %xmm1,%xmm4
+ DB 15,94,231 ; divps %xmm7,%xmm4
+ DB 15,88,225 ; addps %xmm1,%xmm4
+ DB 15,40,248 ; movaps %xmm0,%xmm7
+ DB 15,85,252 ; andnps %xmm4,%xmm7
+ DB 15,84,232 ; andps %xmm0,%xmm5
+ DB 15,86,239 ; orps %xmm7,%xmm5
+ DB 15,40,251 ; movaps %xmm3,%xmm7
+ DB 15,40,231 ; movaps %xmm7,%xmm4
+ DB 15,40,93,168 ; movaps -0x58(%ebp),%xmm3
+ DB 15,89,227 ; mulps %xmm3,%xmm4
+ DB 15,88,223 ; addps %xmm7,%xmm3
+ DB 15,92,220 ; subps %xmm4,%xmm3
+ DB 15,41,93,168 ; movaps %xmm3,-0x58(%ebp)
+ DB 15,41,101,232 ; movaps %xmm4,-0x18(%ebp)
+ DB 15,40,220 ; movaps %xmm4,%xmm3
+ DB 15,40,125,200 ; movaps -0x38(%ebp),%xmm7
+ DB 15,194,223,1 ; cmpltps %xmm7,%xmm3
+ DB 15,40,227 ; movaps %xmm3,%xmm4
DB 15,85,229 ; andnps %xmm5,%xmm4
- DB 15,41,101,136 ; movaps %xmm4,-0x78(%ebp)
- DB 15,92,232 ; subps %xmm0,%xmm5
- DB 15,40,101,216 ; movaps -0x28(%ebp),%xmm4
- DB 15,92,224 ; subps %xmm0,%xmm4
- DB 15,41,101,216 ; movaps %xmm4,-0x28(%ebp)
+ DB 15,41,101,184 ; movaps %xmm4,-0x48(%ebp)
+ DB 15,92,233 ; subps %xmm1,%xmm5
+ DB 15,40,101,232 ; movaps -0x18(%ebp),%xmm4
+ DB 15,92,225 ; subps %xmm1,%xmm4
+ DB 15,41,101,232 ; movaps %xmm4,-0x18(%ebp)
DB 15,89,236 ; mulps %xmm4,%xmm5
- DB 15,92,240 ; subps %xmm0,%xmm6
- DB 15,41,117,184 ; movaps %xmm6,-0x48(%ebp)
- DB 15,94,238 ; divps %xmm6,%xmm5
- DB 15,88,232 ; addps %xmm0,%xmm5
- DB 15,84,234 ; andps %xmm2,%xmm5
- DB 15,86,109,136 ; orps -0x78(%ebp),%xmm5
+ DB 15,92,249 ; subps %xmm1,%xmm7
+ DB 15,41,125,200 ; movaps %xmm7,-0x38(%ebp)
+ DB 15,94,239 ; divps %xmm7,%xmm5
+ DB 15,88,233 ; addps %xmm1,%xmm5
+ DB 15,84,235 ; andps %xmm3,%xmm5
+ DB 15,86,109,184 ; orps -0x48(%ebp),%xmm5
+ DB 15,40,230 ; movaps %xmm6,%xmm4
+ DB 15,92,225 ; subps %xmm1,%xmm4
+ DB 15,89,225 ; mulps %xmm1,%xmm4
+ DB 15,94,101,216 ; divps -0x28(%ebp),%xmm4
+ DB 15,88,225 ; addps %xmm1,%xmm4
+ DB 15,40,248 ; movaps %xmm0,%xmm7
+ DB 15,85,252 ; andnps %xmm4,%xmm7
+ DB 15,84,240 ; andps %xmm0,%xmm6
+ DB 15,86,247 ; orps %xmm7,%xmm6
DB 15,40,227 ; movaps %xmm3,%xmm4
- DB 15,92,224 ; subps %xmm0,%xmm4
- DB 15,89,224 ; mulps %xmm0,%xmm4
- DB 15,94,101,200 ; divps -0x38(%ebp),%xmm4
- DB 15,88,224 ; addps %xmm0,%xmm4
- DB 15,40,247 ; movaps %xmm7,%xmm6
- DB 15,85,244 ; andnps %xmm4,%xmm6
- DB 15,84,223 ; andps %xmm7,%xmm3
- DB 15,86,222 ; orps %xmm6,%xmm3
+ DB 15,85,230 ; andnps %xmm6,%xmm4
+ DB 15,92,241 ; subps %xmm1,%xmm6
+ DB 15,40,125,232 ; movaps -0x18(%ebp),%xmm7
+ DB 15,89,247 ; mulps %xmm7,%xmm6
+ DB 15,94,117,200 ; divps -0x38(%ebp),%xmm6
+ DB 15,88,241 ; addps %xmm1,%xmm6
+ DB 15,84,243 ; andps %xmm3,%xmm6
+ DB 15,86,244 ; orps %xmm4,%xmm6
DB 15,40,226 ; movaps %xmm2,%xmm4
- DB 15,85,227 ; andnps %xmm3,%xmm4
- DB 15,92,216 ; subps %xmm0,%xmm3
- DB 15,40,117,216 ; movaps -0x28(%ebp),%xmm6
- DB 15,89,222 ; mulps %xmm6,%xmm3
- DB 15,94,93,184 ; divps -0x48(%ebp),%xmm3
- DB 15,88,216 ; addps %xmm0,%xmm3
- DB 15,84,218 ; andps %xmm2,%xmm3
- DB 15,86,220 ; orps %xmm4,%xmm3
- DB 15,40,225 ; movaps %xmm1,%xmm4
- DB 15,92,224 ; subps %xmm0,%xmm4
- DB 15,89,224 ; mulps %xmm0,%xmm4
- DB 15,94,101,200 ; divps -0x38(%ebp),%xmm4
- DB 15,88,224 ; addps %xmm0,%xmm4
- DB 15,84,207 ; andps %xmm7,%xmm1
- DB 15,85,252 ; andnps %xmm4,%xmm7
- DB 15,86,249 ; orps %xmm1,%xmm7
- DB 15,40,202 ; movaps %xmm2,%xmm1
- DB 15,85,207 ; andnps %xmm7,%xmm1
- DB 15,92,248 ; subps %xmm0,%xmm7
- DB 15,89,254 ; mulps %xmm6,%xmm7
- DB 15,94,125,184 ; divps -0x48(%ebp),%xmm7
- DB 15,88,248 ; addps %xmm0,%xmm7
- DB 15,84,250 ; andps %xmm2,%xmm7
- DB 15,86,249 ; orps %xmm1,%xmm7
- DB 15,87,192 ; xorps %xmm0,%xmm0
- DB 15,95,232 ; maxps %xmm0,%xmm5
- DB 15,95,216 ; maxps %xmm0,%xmm3
- DB 15,95,248 ; maxps %xmm0,%xmm7
- DB 15,40,101,152 ; movaps -0x68(%ebp),%xmm4
- DB 15,40,196 ; movaps %xmm4,%xmm0
- DB 15,40,117,40 ; movaps 0x28(%ebp),%xmm6
- DB 15,89,198 ; mulps %xmm6,%xmm0
+ DB 15,92,225 ; subps %xmm1,%xmm4
+ DB 15,89,225 ; mulps %xmm1,%xmm4
+ DB 15,94,101,216 ; divps -0x28(%ebp),%xmm4
+ DB 15,88,225 ; addps %xmm1,%xmm4
+ DB 15,84,208 ; andps %xmm0,%xmm2
+ DB 15,85,196 ; andnps %xmm4,%xmm0
+ DB 15,86,194 ; orps %xmm2,%xmm0
+ DB 15,40,211 ; movaps %xmm3,%xmm2
+ DB 15,85,208 ; andnps %xmm0,%xmm2
+ DB 15,92,193 ; subps %xmm1,%xmm0
+ DB 15,89,199 ; mulps %xmm7,%xmm0
+ DB 15,94,69,200 ; divps -0x38(%ebp),%xmm0
+ DB 15,88,193 ; addps %xmm1,%xmm0
+ DB 15,84,195 ; andps %xmm3,%xmm0
+ DB 15,86,194 ; orps %xmm2,%xmm0
+ DB 15,87,201 ; xorps %xmm1,%xmm1
+ DB 15,95,233 ; maxps %xmm1,%xmm5
+ DB 15,95,241 ; maxps %xmm1,%xmm6
+ DB 15,95,193 ; maxps %xmm1,%xmm0
+ DB 15,40,157,72,255,255,255 ; movaps -0xb8(%ebp),%xmm3
+ DB 15,88,93,136 ; addps -0x78(%ebp),%xmm3
+ DB 15,88,221 ; addps %xmm5,%xmm3
DB 15,40,141,88,255,255,255 ; movaps -0xa8(%ebp),%xmm1
- DB 15,88,200 ; addps %xmm0,%xmm1
- DB 15,88,205 ; addps %xmm5,%xmm1
- DB 15,40,193 ; movaps %xmm1,%xmm0
- DB 15,40,212 ; movaps %xmm4,%xmm2
- DB 15,40,109,56 ; movaps 0x38(%ebp),%xmm5
- DB 15,89,213 ; mulps %xmm5,%xmm2
- DB 15,40,141,104,255,255,255 ; movaps -0x98(%ebp),%xmm1
- DB 15,88,202 ; addps %xmm2,%xmm1
- DB 15,88,203 ; addps %xmm3,%xmm1
- DB 15,40,93,72 ; movaps 0x48(%ebp),%xmm3
- DB 15,89,227 ; mulps %xmm3,%xmm4
- DB 15,88,165,120,255,255,255 ; addps -0x88(%ebp),%xmm4
- DB 15,88,231 ; addps %xmm7,%xmm4
- DB 15,40,212 ; movaps %xmm4,%xmm2
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
- DB 139,85,20 ; mov 0x14(%ebp),%edx
- DB 139,117,24 ; mov 0x18(%ebp),%esi
- DB 139,125,12 ; mov 0xc(%ebp),%edi
- DB 141,95,4 ; lea 0x4(%edi),%ebx
- DB 15,40,101,88 ; movaps 0x58(%ebp),%xmm4
- DB 15,41,100,36,80 ; movaps %xmm4,0x50(%esp)
- DB 15,41,92,36,64 ; movaps %xmm3,0x40(%esp)
- DB 15,41,108,36,48 ; movaps %xmm5,0x30(%esp)
- DB 15,41,116,36,32 ; movaps %xmm6,0x20(%esp)
- DB 137,116,36,16 ; mov %esi,0x10(%esp)
- DB 137,84,36,12 ; mov %edx,0xc(%esp)
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
+ DB 15,88,77,152 ; addps -0x68(%ebp),%xmm1
+ DB 15,88,206 ; addps %xmm6,%xmm1
+ DB 15,40,149,120,255,255,255 ; movaps -0x88(%ebp),%xmm2
+ DB 15,88,149,104,255,255,255 ; addps -0x98(%ebp),%xmm2
+ DB 15,88,208 ; addps %xmm0,%xmm2
+ DB 139,77,12 ; mov 0xc(%ebp),%ecx
+ DB 141,81,4 ; lea 0x4(%ecx),%edx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 15,40,195 ; movaps %xmm3,%xmm0
DB 15,40,93,168 ; movaps -0x58(%ebp),%xmm3
- DB 255,23 ; call *(%edi)
- DB 129,196,252,0,0,0 ; add $0xfc,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 82 ; push %edx
+ DB 80 ; push %eax
+ DB 255,17 ; call *(%ecx)
+ DB 129,196,200,0,0,0 ; add $0xc8,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -39116,177 +38512,135 @@ _sk_srcover_rgba_8888_sse2 LABEL PROC
DB 83 ; push %ebx
DB 87 ; push %edi
DB 86 ; push %esi
- DB 129,236,188,0,0,0 ; sub $0xbc,%esp
- DB 15,41,93,152 ; movaps %xmm3,-0x68(%ebp)
- DB 15,41,85,168 ; movaps %xmm2,-0x58(%ebp)
- DB 15,41,77,184 ; movaps %xmm1,-0x48(%ebp)
- DB 102,15,127,69,200 ; movdqa %xmm0,-0x38(%ebp)
- DB 232,0,0,0,0 ; call 242c <_sk_srcover_rgba_8888_sse2+0x22>
+ DB 131,236,44 ; sub $0x2c,%esp
+ DB 102,15,127,85,200 ; movdqa %xmm2,-0x38(%ebp)
+ DB 15,41,77,216 ; movaps %xmm1,-0x28(%ebp)
+ DB 232,0,0,0,0 ; call 1c82 <_sk_srcover_rgba_8888_sse2+0x17>
DB 95 ; pop %edi
- DB 139,77,20 ; mov 0x14(%ebp),%ecx
DB 139,69,12 ; mov 0xc(%ebp),%eax
- DB 139,16 ; mov (%eax),%edx
- DB 139,114,4 ; mov 0x4(%edx),%esi
- DB 15,175,241 ; imul %ecx,%esi
- DB 193,230,2 ; shl $0x2,%esi
- DB 3,50 ; add (%edx),%esi
- DB 139,93,24 ; mov 0x18(%ebp),%ebx
+ DB 139,77,8 ; mov 0x8(%ebp),%ecx
+ DB 139,48 ; mov (%eax),%esi
+ DB 139,86,4 ; mov 0x4(%esi),%edx
+ DB 15,175,81,4 ; imul 0x4(%ecx),%edx
+ DB 193,226,2 ; shl $0x2,%edx
+ DB 3,22 ; add (%esi),%edx
+ DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 133,219 ; test %ebx,%ebx
- DB 139,85,16 ; mov 0x10(%ebp),%edx
- DB 15,133,47,1,0,0 ; jne 257d <_sk_srcover_rgba_8888_sse2+0x173>
- DB 243,15,111,4,150 ; movdqu (%esi,%edx,4),%xmm0
- DB 102,15,111,143,4,112,0,0 ; movdqa 0x7004(%edi),%xmm1
- DB 102,15,111,208 ; movdqa %xmm0,%xmm2
- DB 102,15,219,209 ; pand %xmm1,%xmm2
- DB 102,15,111,248 ; movdqa %xmm0,%xmm7
- DB 102,15,114,215,8 ; psrld $0x8,%xmm7
- DB 102,15,219,249 ; pand %xmm1,%xmm7
- DB 102,15,111,232 ; movdqa %xmm0,%xmm5
- DB 102,15,114,213,16 ; psrld $0x10,%xmm5
- DB 102,15,219,233 ; pand %xmm1,%xmm5
- DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,40,183,20,112,0,0 ; movaps 0x7014(%edi),%xmm6
- DB 15,40,93,152 ; movaps -0x68(%ebp),%xmm3
- DB 15,92,243 ; subps %xmm3,%xmm6
- DB 15,40,167,36,112,0,0 ; movaps 0x7024(%edi),%xmm4
- DB 15,41,101,216 ; movaps %xmm4,-0x28(%ebp)
- DB 15,40,77,200 ; movaps -0x38(%ebp),%xmm1
- DB 15,89,204 ; mulps %xmm4,%xmm1
- DB 15,40,230 ; movaps %xmm6,%xmm4
- DB 15,41,85,200 ; movaps %xmm2,-0x38(%ebp)
- DB 15,89,226 ; mulps %xmm2,%xmm4
- DB 15,88,225 ; addps %xmm1,%xmm4
- DB 15,91,215 ; cvtdq2ps %xmm7,%xmm2
- DB 15,40,125,184 ; movaps -0x48(%ebp),%xmm7
- DB 15,89,125,216 ; mulps -0x28(%ebp),%xmm7
- DB 15,40,206 ; movaps %xmm6,%xmm1
- DB 15,41,85,184 ; movaps %xmm2,-0x48(%ebp)
- DB 15,89,202 ; mulps %xmm2,%xmm1
- DB 15,88,207 ; addps %xmm7,%xmm1
- DB 15,91,213 ; cvtdq2ps %xmm5,%xmm2
- DB 15,40,109,168 ; movaps -0x58(%ebp),%xmm5
- DB 15,89,109,216 ; mulps -0x28(%ebp),%xmm5
- DB 15,40,254 ; movaps %xmm6,%xmm7
- DB 15,41,85,168 ; movaps %xmm2,-0x58(%ebp)
- DB 15,89,250 ; mulps %xmm2,%xmm7
- DB 15,88,253 ; addps %xmm5,%xmm7
- DB 15,89,93,216 ; mulps -0x28(%ebp),%xmm3
- DB 102,15,114,208,24 ; psrld $0x18,%xmm0
- DB 15,91,232 ; cvtdq2ps %xmm0,%xmm5
- DB 15,40,196 ; movaps %xmm4,%xmm0
- DB 15,40,225 ; movaps %xmm1,%xmm4
+ DB 139,49 ; mov (%ecx),%esi
+ DB 15,133,224,0,0,0 ; jne 1d84 <_sk_srcover_rgba_8888_sse2+0x119>
+ DB 243,15,111,20,178 ; movdqu (%edx,%esi,4),%xmm2
+ DB 102,15,111,167,206,84,0,0 ; movdqa 0x54ce(%edi),%xmm4
+ DB 102,15,111,234 ; movdqa %xmm2,%xmm5
+ DB 102,15,219,236 ; pand %xmm4,%xmm5
+ DB 102,15,111,242 ; movdqa %xmm2,%xmm6
+ DB 102,15,114,214,8 ; psrld $0x8,%xmm6
+ DB 102,15,219,244 ; pand %xmm4,%xmm6
+ DB 102,15,111,250 ; movdqa %xmm2,%xmm7
+ DB 102,15,114,215,16 ; psrld $0x10,%xmm7
+ DB 102,15,219,252 ; pand %xmm4,%xmm7
+ DB 15,91,229 ; cvtdq2ps %xmm5,%xmm4
+ DB 15,41,97,16 ; movaps %xmm4,0x10(%ecx)
+ DB 15,40,175,222,84,0,0 ; movaps 0x54de(%edi),%xmm5
+ DB 15,92,235 ; subps %xmm3,%xmm5
+ DB 15,40,143,238,84,0,0 ; movaps 0x54ee(%edi),%xmm1
+ DB 15,89,193 ; mulps %xmm1,%xmm0
+ DB 15,89,229 ; mulps %xmm5,%xmm4
+ DB 15,88,224 ; addps %xmm0,%xmm4
+ DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
+ DB 15,41,113,32 ; movaps %xmm6,0x20(%ecx)
+ DB 15,40,69,216 ; movaps -0x28(%ebp),%xmm0
+ DB 15,89,193 ; mulps %xmm1,%xmm0
DB 15,89,245 ; mulps %xmm5,%xmm6
- DB 15,88,243 ; addps %xmm3,%xmm6
- DB 102,15,91,204 ; cvtps2dq %xmm4,%xmm1
+ DB 15,88,240 ; addps %xmm0,%xmm6
+ DB 15,91,255 ; cvtdq2ps %xmm7,%xmm7
+ DB 15,41,121,48 ; movaps %xmm7,0x30(%ecx)
+ DB 15,40,69,200 ; movaps -0x38(%ebp),%xmm0
+ DB 15,89,193 ; mulps %xmm1,%xmm0
+ DB 15,89,253 ; mulps %xmm5,%xmm7
+ DB 15,88,248 ; addps %xmm0,%xmm7
+ DB 102,15,114,210,24 ; psrld $0x18,%xmm2
+ DB 15,91,194 ; cvtdq2ps %xmm2,%xmm0
+ DB 15,41,65,64 ; movaps %xmm0,0x40(%ecx)
+ DB 15,89,217 ; mulps %xmm1,%xmm3
+ DB 15,89,232 ; mulps %xmm0,%xmm5
+ DB 15,88,235 ; addps %xmm3,%xmm5
+ DB 102,15,91,196 ; cvtps2dq %xmm4,%xmm0
+ DB 102,15,91,206 ; cvtps2dq %xmm6,%xmm1
DB 102,15,114,241,8 ; pslld $0x8,%xmm1
- DB 102,15,91,208 ; cvtps2dq %xmm0,%xmm2
- DB 102,15,235,202 ; por %xmm2,%xmm1
+ DB 102,15,235,200 ; por %xmm0,%xmm1
DB 102,15,91,215 ; cvtps2dq %xmm7,%xmm2
DB 102,15,114,242,16 ; pslld $0x10,%xmm2
- DB 102,15,91,222 ; cvtps2dq %xmm6,%xmm3
- DB 102,15,114,243,24 ; pslld $0x18,%xmm3
- DB 102,15,235,218 ; por %xmm2,%xmm3
- DB 102,15,235,217 ; por %xmm1,%xmm3
- DB 139,125,8 ; mov 0x8(%ebp),%edi
+ DB 102,15,91,197 ; cvtps2dq %xmm5,%xmm0
+ DB 102,15,114,240,24 ; pslld $0x18,%xmm0
+ DB 102,15,235,194 ; por %xmm2,%xmm0
+ DB 102,15,235,193 ; por %xmm1,%xmm0
DB 133,219 ; test %ebx,%ebx
- DB 15,133,141,0,0,0 ; jne 25b8 <_sk_srcover_rgba_8888_sse2+0x1ae>
- DB 243,15,127,28,150 ; movdqu %xmm3,(%esi,%edx,4)
- DB 141,112,8 ; lea 0x8(%eax),%esi
- DB 15,41,108,36,80 ; movaps %xmm5,0x50(%esp)
- DB 15,40,77,168 ; movaps -0x58(%ebp),%xmm1
- DB 15,41,76,36,64 ; movaps %xmm1,0x40(%esp)
- DB 15,40,77,184 ; movaps -0x48(%ebp),%xmm1
- DB 15,41,76,36,48 ; movaps %xmm1,0x30(%esp)
- DB 15,40,77,200 ; movaps -0x38(%ebp),%xmm1
- DB 15,41,76,36,32 ; movaps %xmm1,0x20(%esp)
- DB 137,92,36,16 ; mov %ebx,0x10(%esp)
- DB 137,76,36,12 ; mov %ecx,0xc(%esp)
- DB 137,84,36,8 ; mov %edx,0x8(%esp)
- DB 137,116,36,4 ; mov %esi,0x4(%esp)
- DB 137,60,36 ; mov %edi,(%esp)
- DB 15,40,204 ; movaps %xmm4,%xmm1
+ DB 117,95 ; jne 1dbf <_sk_srcover_rgba_8888_sse2+0x154>
+ DB 243,15,127,4,178 ; movdqu %xmm0,(%edx,%esi,4)
+ DB 141,80,8 ; lea 0x8(%eax),%edx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 15,40,196 ; movaps %xmm4,%xmm0
+ DB 15,40,206 ; movaps %xmm6,%xmm1
DB 15,40,215 ; movaps %xmm7,%xmm2
- DB 15,40,222 ; movaps %xmm6,%xmm3
+ DB 15,40,221 ; movaps %xmm5,%xmm3
+ DB 82 ; push %edx
+ DB 81 ; push %ecx
DB 255,80,4 ; call *0x4(%eax)
- DB 129,196,188,0,0,0 ; add $0xbc,%esp
+ DB 131,196,60 ; add $0x3c,%esp
DB 94 ; pop %esi
DB 95 ; pop %edi
DB 91 ; pop %ebx
DB 93 ; pop %ebp
DB 195 ; ret
- DB 137,217 ; mov %ebx,%ecx
- DB 136,77,216 ; mov %cl,-0x28(%ebp)
- DB 128,101,216,3 ; andb $0x3,-0x28(%ebp)
- DB 128,125,216,1 ; cmpb $0x1,-0x28(%ebp)
- DB 116,99 ; je 25ef <_sk_srcover_rgba_8888_sse2+0x1e5>
- DB 102,15,239,192 ; pxor %xmm0,%xmm0
- DB 128,125,216,2 ; cmpb $0x2,-0x28(%ebp)
- DB 139,77,20 ; mov 0x14(%ebp),%ecx
- DB 116,21 ; je 25ae <_sk_srcover_rgba_8888_sse2+0x1a4>
- DB 128,125,216,3 ; cmpb $0x3,-0x28(%ebp)
- DB 15,133,176,254,255,255 ; jne 2453 <_sk_srcover_rgba_8888_sse2+0x49>
- DB 102,15,110,68,150,8 ; movd 0x8(%esi,%edx,4),%xmm0
- DB 102,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm0
- DB 102,15,18,4,150 ; movlpd (%esi,%edx,4),%xmm0
- DB 233,155,254,255,255 ; jmp 2453 <_sk_srcover_rgba_8888_sse2+0x49>
DB 137,216 ; mov %ebx,%eax
- DB 136,69,216 ; mov %al,-0x28(%ebp)
- DB 128,101,216,3 ; andb $0x3,-0x28(%ebp)
- DB 128,125,216,1 ; cmpb $0x1,-0x28(%ebp)
- DB 116,53 ; je 25fc <_sk_srcover_rgba_8888_sse2+0x1f2>
- DB 128,125,216,2 ; cmpb $0x2,-0x28(%ebp)
+ DB 136,69,243 ; mov %al,-0xd(%ebp)
+ DB 128,101,243,3 ; andb $0x3,-0xd(%ebp)
+ DB 128,125,243,1 ; cmpb $0x1,-0xd(%ebp)
+ DB 116,80 ; je 1de3 <_sk_srcover_rgba_8888_sse2+0x178>
+ DB 102,15,239,210 ; pxor %xmm2,%xmm2
+ DB 128,125,243,2 ; cmpb $0x2,-0xd(%ebp)
DB 139,69,12 ; mov 0xc(%ebp),%eax
- DB 116,21 ; je 25e5 <_sk_srcover_rgba_8888_sse2+0x1db>
- DB 128,125,216,3 ; cmpb $0x3,-0x28(%ebp)
- DB 15,133,86,255,255,255 ; jne 2530 <_sk_srcover_rgba_8888_sse2+0x126>
- DB 102,15,112,203,78 ; pshufd $0x4e,%xmm3,%xmm1
- DB 102,15,126,76,150,8 ; movd %xmm1,0x8(%esi,%edx,4)
- DB 102,15,214,28,150 ; movq %xmm3,(%esi,%edx,4)
- DB 233,65,255,255,255 ; jmp 2530 <_sk_srcover_rgba_8888_sse2+0x126>
- DB 102,15,110,4,150 ; movd (%esi,%edx,4),%xmm0
- DB 139,77,20 ; mov 0x14(%ebp),%ecx
- DB 233,87,254,255,255 ; jmp 2453 <_sk_srcover_rgba_8888_sse2+0x49>
- DB 102,15,126,28,150 ; movd %xmm3,(%esi,%edx,4)
+ DB 116,21 ; je 1db5 <_sk_srcover_rgba_8888_sse2+0x14a>
+ DB 128,125,243,3 ; cmpb $0x3,-0xd(%ebp)
+ DB 15,133,255,254,255,255 ; jne 1ca9 <_sk_srcover_rgba_8888_sse2+0x3e>
+ DB 102,15,110,84,178,8 ; movd 0x8(%edx,%esi,4),%xmm2
+ DB 102,15,112,210,69 ; pshufd $0x45,%xmm2,%xmm2
+ DB 102,15,18,20,178 ; movlpd (%edx,%esi,4),%xmm2
+ DB 233,234,254,255,255 ; jmp 1ca9 <_sk_srcover_rgba_8888_sse2+0x3e>
+ DB 128,227,3 ; and $0x3,%bl
+ DB 128,251,1 ; cmp $0x1,%bl
+ DB 116,41 ; je 1df0 <_sk_srcover_rgba_8888_sse2+0x185>
+ DB 128,251,2 ; cmp $0x2,%bl
+ DB 116,16 ; je 1ddc <_sk_srcover_rgba_8888_sse2+0x171>
+ DB 128,251,3 ; cmp $0x3,%bl
+ DB 117,148 ; jne 1d65 <_sk_srcover_rgba_8888_sse2+0xfa>
+ DB 102,15,112,200,78 ; pshufd $0x4e,%xmm0,%xmm1
+ DB 102,15,126,76,178,8 ; movd %xmm1,0x8(%edx,%esi,4)
+ DB 102,15,214,4,178 ; movq %xmm0,(%edx,%esi,4)
+ DB 235,130 ; jmp 1d65 <_sk_srcover_rgba_8888_sse2+0xfa>
+ DB 102,15,110,20,178 ; movd (%edx,%esi,4),%xmm2
DB 139,69,12 ; mov 0xc(%ebp),%eax
- DB 233,39,255,255,255 ; jmp 2530 <_sk_srcover_rgba_8888_sse2+0x126>
+ DB 233,185,254,255,255 ; jmp 1ca9 <_sk_srcover_rgba_8888_sse2+0x3e>
+ DB 102,15,126,4,178 ; movd %xmm0,(%edx,%esi,4)
+ DB 233,107,255,255,255 ; jmp 1d65 <_sk_srcover_rgba_8888_sse2+0xfa>
PUBLIC _sk_clamp_0_sse2
_sk_clamp_0_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
- DB 139,85,20 ; mov 0x14(%ebp),%edx
- DB 139,117,24 ; mov 0x18(%ebp),%esi
- DB 15,40,101,40 ; movaps 0x28(%ebp),%xmm4
- DB 15,40,109,56 ; movaps 0x38(%ebp),%xmm5
- DB 15,40,117,72 ; movaps 0x48(%ebp),%xmm6
- DB 15,87,255 ; xorps %xmm7,%xmm7
- DB 15,95,199 ; maxps %xmm7,%xmm0
- DB 15,95,207 ; maxps %xmm7,%xmm1
- DB 15,95,215 ; maxps %xmm7,%xmm2
- DB 15,95,223 ; maxps %xmm7,%xmm3
- DB 15,40,125,88 ; movaps 0x58(%ebp),%xmm7
- DB 139,125,12 ; mov 0xc(%ebp),%edi
- DB 141,95,4 ; lea 0x4(%edi),%ebx
- DB 15,41,124,36,80 ; movaps %xmm7,0x50(%esp)
- DB 15,41,116,36,64 ; movaps %xmm6,0x40(%esp)
- DB 15,41,108,36,48 ; movaps %xmm5,0x30(%esp)
- DB 15,41,100,36,32 ; movaps %xmm4,0x20(%esp)
- DB 137,116,36,16 ; mov %esi,0x10(%esp)
- DB 137,84,36,12 ; mov %edx,0xc(%esp)
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
- DB 255,23 ; call *(%edi)
- DB 131,196,108 ; add $0x6c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 139,69,12 ; mov 0xc(%ebp),%eax
+ DB 15,87,228 ; xorps %xmm4,%xmm4
+ DB 15,95,196 ; maxps %xmm4,%xmm0
+ DB 15,95,204 ; maxps %xmm4,%xmm1
+ DB 15,95,212 ; maxps %xmm4,%xmm2
+ DB 15,95,220 ; maxps %xmm4,%xmm3
+ DB 141,72,4 ; lea 0x4(%eax),%ecx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 81 ; push %ecx
+ DB 255,117,8 ; pushl 0x8(%ebp)
+ DB 255,16 ; call *(%eax)
+ DB 131,196,24 ; add $0x18,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -39294,41 +38648,21 @@ PUBLIC _sk_clamp_1_sse2
_sk_clamp_1_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 232,0,0,0,0 ; call 2682 <_sk_clamp_1_sse2+0xe>
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 232,0,0,0,0 ; call 1e2e <_sk_clamp_1_sse2+0xb>
DB 88 ; pop %eax
- DB 139,77,8 ; mov 0x8(%ebp),%ecx
- DB 139,85,16 ; mov 0x10(%ebp),%edx
- DB 139,117,20 ; mov 0x14(%ebp),%esi
- DB 139,125,24 ; mov 0x18(%ebp),%edi
- DB 15,40,101,40 ; movaps 0x28(%ebp),%xmm4
- DB 15,40,109,56 ; movaps 0x38(%ebp),%xmm5
- DB 15,40,117,72 ; movaps 0x48(%ebp),%xmm6
- DB 15,40,184,222,109,0,0 ; movaps 0x6dde(%eax),%xmm7
- DB 15,93,199 ; minps %xmm7,%xmm0
- DB 15,93,207 ; minps %xmm7,%xmm1
- DB 15,93,215 ; minps %xmm7,%xmm2
- DB 15,93,223 ; minps %xmm7,%xmm3
- DB 15,40,125,88 ; movaps 0x58(%ebp),%xmm7
- DB 139,69,12 ; mov 0xc(%ebp),%eax
- DB 141,88,4 ; lea 0x4(%eax),%ebx
- DB 15,41,124,36,80 ; movaps %xmm7,0x50(%esp)
- DB 15,41,116,36,64 ; movaps %xmm6,0x40(%esp)
- DB 15,41,108,36,48 ; movaps %xmm5,0x30(%esp)
- DB 15,41,100,36,32 ; movaps %xmm4,0x20(%esp)
- DB 137,124,36,16 ; mov %edi,0x10(%esp)
- DB 137,116,36,12 ; mov %esi,0xc(%esp)
- DB 137,84,36,8 ; mov %edx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,12,36 ; mov %ecx,(%esp)
- DB 255,16 ; call *(%eax)
- DB 131,196,108 ; add $0x6c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 139,77,12 ; mov 0xc(%ebp),%ecx
+ DB 15,40,160,82,83,0,0 ; movaps 0x5352(%eax),%xmm4
+ DB 15,93,196 ; minps %xmm4,%xmm0
+ DB 15,93,204 ; minps %xmm4,%xmm1
+ DB 15,93,212 ; minps %xmm4,%xmm2
+ DB 15,93,220 ; minps %xmm4,%xmm3
+ DB 141,65,4 ; lea 0x4(%ecx),%eax
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 80 ; push %eax
+ DB 255,117,8 ; pushl 0x8(%ebp)
+ DB 255,17 ; call *(%ecx)
+ DB 131,196,24 ; add $0x18,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -39336,40 +38670,20 @@ PUBLIC _sk_clamp_a_sse2
_sk_clamp_a_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 232,0,0,0,0 ; call 26f7 <_sk_clamp_a_sse2+0xe>
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 232,0,0,0,0 ; call 1e61 <_sk_clamp_a_sse2+0xb>
DB 88 ; pop %eax
- DB 139,77,8 ; mov 0x8(%ebp),%ecx
- DB 139,85,16 ; mov 0x10(%ebp),%edx
- DB 139,117,20 ; mov 0x14(%ebp),%esi
- DB 139,125,24 ; mov 0x18(%ebp),%edi
- DB 15,40,101,40 ; movaps 0x28(%ebp),%xmm4
- DB 15,40,109,56 ; movaps 0x38(%ebp),%xmm5
- DB 15,40,117,72 ; movaps 0x48(%ebp),%xmm6
- DB 15,40,125,88 ; movaps 0x58(%ebp),%xmm7
- DB 15,93,152,121,109,0,0 ; minps 0x6d79(%eax),%xmm3
- DB 139,69,12 ; mov 0xc(%ebp),%eax
+ DB 139,77,12 ; mov 0xc(%ebp),%ecx
+ DB 15,93,152,47,83,0,0 ; minps 0x532f(%eax),%xmm3
DB 15,93,195 ; minps %xmm3,%xmm0
DB 15,93,203 ; minps %xmm3,%xmm1
DB 15,93,211 ; minps %xmm3,%xmm2
- DB 141,88,4 ; lea 0x4(%eax),%ebx
- DB 15,41,124,36,80 ; movaps %xmm7,0x50(%esp)
- DB 15,41,116,36,64 ; movaps %xmm6,0x40(%esp)
- DB 15,41,108,36,48 ; movaps %xmm5,0x30(%esp)
- DB 15,41,100,36,32 ; movaps %xmm4,0x20(%esp)
- DB 137,124,36,16 ; mov %edi,0x10(%esp)
- DB 137,116,36,12 ; mov %esi,0xc(%esp)
- DB 137,84,36,8 ; mov %edx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,12,36 ; mov %ecx,(%esp)
- DB 255,16 ; call *(%eax)
- DB 131,196,108 ; add $0x6c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 141,65,4 ; lea 0x4(%ecx),%eax
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 80 ; push %eax
+ DB 255,117,8 ; pushl 0x8(%ebp)
+ DB 255,17 ; call *(%ecx)
+ DB 131,196,24 ; add $0x18,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -39377,40 +38691,29 @@ PUBLIC _sk_clamp_a_dst_sse2
_sk_clamp_a_dst_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 232,0,0,0,0 ; call 2769 <_sk_clamp_a_dst_sse2+0xe>
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 232,0,0,0,0 ; call 1e91 <_sk_clamp_a_dst_sse2+0xb>
DB 88 ; pop %eax
- DB 139,77,8 ; mov 0x8(%ebp),%ecx
- DB 139,85,16 ; mov 0x10(%ebp),%edx
- DB 139,117,20 ; mov 0x14(%ebp),%esi
- DB 139,125,24 ; mov 0x18(%ebp),%edi
- DB 15,40,101,88 ; movaps 0x58(%ebp),%xmm4
- DB 15,93,160,23,109,0,0 ; minps 0x6d17(%eax),%xmm4
- DB 139,69,12 ; mov 0xc(%ebp),%eax
- DB 15,40,109,72 ; movaps 0x48(%ebp),%xmm5
- DB 15,40,117,56 ; movaps 0x38(%ebp),%xmm6
- DB 15,40,125,40 ; movaps 0x28(%ebp),%xmm7
- DB 15,93,252 ; minps %xmm4,%xmm7
- DB 15,93,244 ; minps %xmm4,%xmm6
+ DB 139,77,12 ; mov 0xc(%ebp),%ecx
+ DB 139,85,8 ; mov 0x8(%ebp),%edx
+ DB 15,40,98,64 ; movaps 0x40(%edx),%xmm4
+ DB 15,93,160,15,83,0,0 ; minps 0x530f(%eax),%xmm4
+ DB 15,41,98,64 ; movaps %xmm4,0x40(%edx)
+ DB 15,40,106,16 ; movaps 0x10(%edx),%xmm5
DB 15,93,236 ; minps %xmm4,%xmm5
- DB 141,88,4 ; lea 0x4(%eax),%ebx
- DB 15,41,100,36,80 ; movaps %xmm4,0x50(%esp)
- DB 137,124,36,16 ; mov %edi,0x10(%esp)
- DB 137,116,36,12 ; mov %esi,0xc(%esp)
- DB 137,84,36,8 ; mov %edx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,12,36 ; mov %ecx,(%esp)
- DB 15,41,108,36,64 ; movaps %xmm5,0x40(%esp)
- DB 15,41,116,36,48 ; movaps %xmm6,0x30(%esp)
- DB 15,41,124,36,32 ; movaps %xmm7,0x20(%esp)
- DB 255,16 ; call *(%eax)
- DB 131,196,108 ; add $0x6c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 15,41,106,16 ; movaps %xmm5,0x10(%edx)
+ DB 15,40,106,32 ; movaps 0x20(%edx),%xmm5
+ DB 15,93,236 ; minps %xmm4,%xmm5
+ DB 15,41,106,32 ; movaps %xmm5,0x20(%edx)
+ DB 15,40,106,48 ; movaps 0x30(%edx),%xmm5
+ DB 15,93,236 ; minps %xmm4,%xmm5
+ DB 15,41,106,48 ; movaps %xmm5,0x30(%edx)
+ DB 141,65,4 ; lea 0x4(%ecx),%eax
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 80 ; push %eax
+ DB 82 ; push %edx
+ DB 255,17 ; call *(%ecx)
+ DB 131,196,24 ; add $0x18,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -39418,41 +38721,21 @@ PUBLIC _sk_set_rgb_sse2
_sk_set_rgb_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
- DB 139,85,20 ; mov 0x14(%ebp),%edx
- DB 139,117,12 ; mov 0xc(%ebp),%esi
- DB 139,62 ; mov (%esi),%edi
- DB 243,15,16,7 ; movss (%edi),%xmm0
- DB 243,15,16,79,4 ; movss 0x4(%edi),%xmm1
- DB 243,15,16,87,8 ; movss 0x8(%edi),%xmm2
- DB 139,125,24 ; mov 0x18(%ebp),%edi
- DB 15,40,101,40 ; movaps 0x28(%ebp),%xmm4
- DB 15,40,109,56 ; movaps 0x38(%ebp),%xmm5
- DB 15,40,117,72 ; movaps 0x48(%ebp),%xmm6
- DB 15,40,125,88 ; movaps 0x58(%ebp),%xmm7
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 139,69,12 ; mov 0xc(%ebp),%eax
+ DB 139,8 ; mov (%eax),%ecx
+ DB 243,15,16,1 ; movss (%ecx),%xmm0
+ DB 243,15,16,73,4 ; movss 0x4(%ecx),%xmm1
DB 15,198,192,0 ; shufps $0x0,%xmm0,%xmm0
DB 15,198,201,0 ; shufps $0x0,%xmm1,%xmm1
+ DB 243,15,16,81,8 ; movss 0x8(%ecx),%xmm2
DB 15,198,210,0 ; shufps $0x0,%xmm2,%xmm2
- DB 141,94,8 ; lea 0x8(%esi),%ebx
- DB 15,41,124,36,80 ; movaps %xmm7,0x50(%esp)
- DB 15,41,116,36,64 ; movaps %xmm6,0x40(%esp)
- DB 15,41,108,36,48 ; movaps %xmm5,0x30(%esp)
- DB 15,41,100,36,32 ; movaps %xmm4,0x20(%esp)
- DB 137,124,36,16 ; mov %edi,0x10(%esp)
- DB 137,84,36,12 ; mov %edx,0xc(%esp)
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
- DB 255,86,4 ; call *0x4(%esi)
- DB 131,196,108 ; add $0x6c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 141,72,8 ; lea 0x8(%eax),%ecx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 81 ; push %ecx
+ DB 255,117,8 ; pushl 0x8(%ebp)
+ DB 255,80,4 ; call *0x4(%eax)
+ DB 131,196,24 ; add $0x18,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -39460,37 +38743,17 @@ PUBLIC _sk_swap_rb_sse2
_sk_swap_rb_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
+ DB 131,236,8 ; sub $0x8,%esp
DB 15,40,224 ; movaps %xmm0,%xmm4
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
- DB 139,85,20 ; mov 0x14(%ebp),%edx
- DB 139,117,24 ; mov 0x18(%ebp),%esi
- DB 15,40,69,40 ; movaps 0x28(%ebp),%xmm0
- DB 15,40,109,56 ; movaps 0x38(%ebp),%xmm5
- DB 15,40,117,72 ; movaps 0x48(%ebp),%xmm6
- DB 15,40,125,88 ; movaps 0x58(%ebp),%xmm7
- DB 139,125,12 ; mov 0xc(%ebp),%edi
- DB 141,95,4 ; lea 0x4(%edi),%ebx
- DB 15,41,124,36,80 ; movaps %xmm7,0x50(%esp)
- DB 15,41,116,36,64 ; movaps %xmm6,0x40(%esp)
- DB 15,41,108,36,48 ; movaps %xmm5,0x30(%esp)
- DB 15,41,68,36,32 ; movaps %xmm0,0x20(%esp)
- DB 137,116,36,16 ; mov %esi,0x10(%esp)
- DB 137,84,36,12 ; mov %edx,0xc(%esp)
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
+ DB 139,69,12 ; mov 0xc(%ebp),%eax
+ DB 141,72,4 ; lea 0x4(%eax),%ecx
+ DB 131,236,8 ; sub $0x8,%esp
DB 15,40,194 ; movaps %xmm2,%xmm0
DB 15,40,212 ; movaps %xmm4,%xmm2
- DB 255,23 ; call *(%edi)
- DB 131,196,108 ; add $0x6c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 81 ; push %ecx
+ DB 255,117,8 ; pushl 0x8(%ebp)
+ DB 255,16 ; call *(%eax)
+ DB 131,196,24 ; add $0x18,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -39498,30 +38761,19 @@ PUBLIC _sk_move_src_dst_sse2
_sk_move_src_dst_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
- DB 139,85,20 ; mov 0x14(%ebp),%edx
- DB 139,117,24 ; mov 0x18(%ebp),%esi
- DB 139,125,12 ; mov 0xc(%ebp),%edi
- DB 141,95,4 ; lea 0x4(%edi),%ebx
- DB 15,41,92,36,80 ; movaps %xmm3,0x50(%esp)
- DB 15,41,84,36,64 ; movaps %xmm2,0x40(%esp)
- DB 15,41,76,36,48 ; movaps %xmm1,0x30(%esp)
- DB 15,41,68,36,32 ; movaps %xmm0,0x20(%esp)
- DB 137,116,36,16 ; mov %esi,0x10(%esp)
- DB 137,84,36,12 ; mov %edx,0xc(%esp)
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
- DB 255,23 ; call *(%edi)
- DB 131,196,108 ; add $0x6c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 139,69,12 ; mov 0xc(%ebp),%eax
+ DB 139,77,8 ; mov 0x8(%ebp),%ecx
+ DB 15,41,65,16 ; movaps %xmm0,0x10(%ecx)
+ DB 15,41,73,32 ; movaps %xmm1,0x20(%ecx)
+ DB 15,41,81,48 ; movaps %xmm2,0x30(%ecx)
+ DB 15,41,89,64 ; movaps %xmm3,0x40(%ecx)
+ DB 141,80,4 ; lea 0x4(%eax),%edx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 82 ; push %edx
+ DB 81 ; push %ecx
+ DB 255,16 ; call *(%eax)
+ DB 131,196,24 ; add $0x18,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -39529,34 +38781,19 @@ PUBLIC _sk_move_dst_src_sse2
_sk_move_dst_src_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
- DB 139,85,20 ; mov 0x14(%ebp),%edx
- DB 139,117,24 ; mov 0x18(%ebp),%esi
- DB 15,40,69,40 ; movaps 0x28(%ebp),%xmm0
- DB 15,40,77,56 ; movaps 0x38(%ebp),%xmm1
- DB 15,40,85,72 ; movaps 0x48(%ebp),%xmm2
- DB 15,40,93,88 ; movaps 0x58(%ebp),%xmm3
- DB 139,125,12 ; mov 0xc(%ebp),%edi
- DB 141,95,4 ; lea 0x4(%edi),%ebx
- DB 15,41,92,36,80 ; movaps %xmm3,0x50(%esp)
- DB 15,41,84,36,64 ; movaps %xmm2,0x40(%esp)
- DB 15,41,76,36,48 ; movaps %xmm1,0x30(%esp)
- DB 15,41,68,36,32 ; movaps %xmm0,0x20(%esp)
- DB 137,116,36,16 ; mov %esi,0x10(%esp)
- DB 137,84,36,12 ; mov %edx,0xc(%esp)
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
- DB 255,23 ; call *(%edi)
- DB 131,196,108 ; add $0x6c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 139,69,12 ; mov 0xc(%ebp),%eax
+ DB 139,77,8 ; mov 0x8(%ebp),%ecx
+ DB 15,40,65,16 ; movaps 0x10(%ecx),%xmm0
+ DB 15,40,73,32 ; movaps 0x20(%ecx),%xmm1
+ DB 15,40,81,48 ; movaps 0x30(%ecx),%xmm2
+ DB 15,40,89,64 ; movaps 0x40(%ecx),%xmm3
+ DB 141,80,4 ; lea 0x4(%eax),%edx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 82 ; push %edx
+ DB 81 ; push %ecx
+ DB 255,16 ; call *(%eax)
+ DB 131,196,24 ; add $0x18,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -39564,37 +38801,17 @@ PUBLIC _sk_premul_sse2
_sk_premul_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
- DB 139,85,20 ; mov 0x14(%ebp),%edx
- DB 139,117,24 ; mov 0x18(%ebp),%esi
- DB 15,40,101,40 ; movaps 0x28(%ebp),%xmm4
- DB 15,40,109,56 ; movaps 0x38(%ebp),%xmm5
- DB 15,40,117,72 ; movaps 0x48(%ebp),%xmm6
- DB 15,40,125,88 ; movaps 0x58(%ebp),%xmm7
- DB 139,125,12 ; mov 0xc(%ebp),%edi
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 15,89,195 ; mulps %xmm3,%xmm0
DB 15,89,203 ; mulps %xmm3,%xmm1
DB 15,89,211 ; mulps %xmm3,%xmm2
- DB 141,95,4 ; lea 0x4(%edi),%ebx
- DB 15,41,124,36,80 ; movaps %xmm7,0x50(%esp)
- DB 15,41,116,36,64 ; movaps %xmm6,0x40(%esp)
- DB 15,41,108,36,48 ; movaps %xmm5,0x30(%esp)
- DB 15,41,100,36,32 ; movaps %xmm4,0x20(%esp)
- DB 137,116,36,16 ; mov %esi,0x10(%esp)
- DB 137,84,36,12 ; mov %edx,0xc(%esp)
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
- DB 255,23 ; call *(%edi)
- DB 131,196,108 ; add $0x6c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 141,72,4 ; lea 0x4(%eax),%ecx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 81 ; push %ecx
+ DB 255,117,8 ; pushl 0x8(%ebp)
+ DB 255,16 ; call *(%eax)
+ DB 131,196,24 ; add $0x18,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -39602,36 +38819,24 @@ PUBLIC _sk_premul_dst_sse2
_sk_premul_dst_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
- DB 139,85,20 ; mov 0x14(%ebp),%edx
- DB 139,117,24 ; mov 0x18(%ebp),%esi
- DB 139,125,12 ; mov 0xc(%ebp),%edi
- DB 15,40,101,88 ; movaps 0x58(%ebp),%xmm4
- DB 15,40,109,40 ; movaps 0x28(%ebp),%xmm5
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 139,69,12 ; mov 0xc(%ebp),%eax
+ DB 139,77,8 ; mov 0x8(%ebp),%ecx
+ DB 15,40,97,64 ; movaps 0x40(%ecx),%xmm4
+ DB 15,40,105,16 ; movaps 0x10(%ecx),%xmm5
DB 15,89,236 ; mulps %xmm4,%xmm5
- DB 15,40,117,56 ; movaps 0x38(%ebp),%xmm6
- DB 15,89,244 ; mulps %xmm4,%xmm6
- DB 141,95,4 ; lea 0x4(%edi),%ebx
- DB 15,41,100,36,80 ; movaps %xmm4,0x50(%esp)
- DB 15,89,101,72 ; mulps 0x48(%ebp),%xmm4
- DB 15,41,100,36,64 ; movaps %xmm4,0x40(%esp)
- DB 15,41,116,36,48 ; movaps %xmm6,0x30(%esp)
- DB 15,41,108,36,32 ; movaps %xmm5,0x20(%esp)
- DB 137,116,36,16 ; mov %esi,0x10(%esp)
- DB 137,84,36,12 ; mov %edx,0xc(%esp)
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
- DB 255,23 ; call *(%edi)
- DB 131,196,108 ; add $0x6c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 15,41,105,16 ; movaps %xmm5,0x10(%ecx)
+ DB 15,40,105,32 ; movaps 0x20(%ecx),%xmm5
+ DB 15,89,236 ; mulps %xmm4,%xmm5
+ DB 15,41,105,32 ; movaps %xmm5,0x20(%ecx)
+ DB 15,89,97,48 ; mulps 0x30(%ecx),%xmm4
+ DB 15,41,97,48 ; movaps %xmm4,0x30(%ecx)
+ DB 141,80,4 ; lea 0x4(%eax),%edx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 82 ; push %edx
+ DB 81 ; push %ecx
+ DB 255,16 ; call *(%eax)
+ DB 131,196,24 ; add $0x18,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -39639,44 +38844,24 @@ PUBLIC _sk_unpremul_sse2
_sk_unpremul_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 232,0,0,0,0 ; call 2a28 <_sk_unpremul_sse2+0xe>
- DB 89 ; pop %ecx
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,85,16 ; mov 0x10(%ebp),%edx
- DB 139,117,20 ; mov 0x14(%ebp),%esi
- DB 139,125,24 ; mov 0x18(%ebp),%edi
- DB 15,40,101,40 ; movaps 0x28(%ebp),%xmm4
- DB 15,40,109,56 ; movaps 0x38(%ebp),%xmm5
- DB 15,87,246 ; xorps %xmm6,%xmm6
- DB 15,40,185,104,106,0,0 ; movaps 0x6a68(%ecx),%xmm7
- DB 15,94,251 ; divps %xmm3,%xmm7
- DB 15,194,243,4 ; cmpneqps %xmm3,%xmm6
- DB 15,84,247 ; andps %xmm7,%xmm6
- DB 15,40,125,72 ; movaps 0x48(%ebp),%xmm7
- DB 15,89,198 ; mulps %xmm6,%xmm0
- DB 15,89,206 ; mulps %xmm6,%xmm1
- DB 15,89,214 ; mulps %xmm6,%xmm2
- DB 15,40,117,88 ; movaps 0x58(%ebp),%xmm6
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 232,0,0,0,0 ; call 1ff2 <_sk_unpremul_sse2+0xb>
+ DB 88 ; pop %eax
DB 139,77,12 ; mov 0xc(%ebp),%ecx
- DB 141,89,4 ; lea 0x4(%ecx),%ebx
- DB 15,41,116,36,80 ; movaps %xmm6,0x50(%esp)
- DB 15,41,124,36,64 ; movaps %xmm7,0x40(%esp)
- DB 15,41,108,36,48 ; movaps %xmm5,0x30(%esp)
- DB 15,41,100,36,32 ; movaps %xmm4,0x20(%esp)
- DB 137,124,36,16 ; mov %edi,0x10(%esp)
- DB 137,116,36,12 ; mov %esi,0xc(%esp)
- DB 137,84,36,8 ; mov %edx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
+ DB 15,87,228 ; xorps %xmm4,%xmm4
+ DB 15,40,168,190,81,0,0 ; movaps 0x51be(%eax),%xmm5
+ DB 15,94,235 ; divps %xmm3,%xmm5
+ DB 15,194,227,4 ; cmpneqps %xmm3,%xmm4
+ DB 15,84,229 ; andps %xmm5,%xmm4
+ DB 15,89,196 ; mulps %xmm4,%xmm0
+ DB 15,89,204 ; mulps %xmm4,%xmm1
+ DB 15,89,212 ; mulps %xmm4,%xmm2
+ DB 141,65,4 ; lea 0x4(%ecx),%eax
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 80 ; push %eax
+ DB 255,117,8 ; pushl 0x8(%ebp)
DB 255,17 ; call *(%ecx)
- DB 131,196,108 ; add $0x6c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 131,196,24 ; add $0x18,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -39684,87 +38869,67 @@ PUBLIC _sk_from_srgb_sse2
_sk_from_srgb_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 129,236,156,0,0,0 ; sub $0x9c,%esp
- DB 15,41,93,184 ; movaps %xmm3,-0x48(%ebp)
- DB 15,40,242 ; movaps %xmm2,%xmm6
- DB 15,40,233 ; movaps %xmm1,%xmm5
+ DB 131,236,56 ; sub $0x38,%esp
+ DB 15,41,93,200 ; movaps %xmm3,-0x38(%ebp)
+ DB 15,40,234 ; movaps %xmm2,%xmm5
+ DB 15,40,217 ; movaps %xmm1,%xmm3
DB 15,40,208 ; movaps %xmm0,%xmm2
- DB 232,0,0,0,0 ; call 2ab7 <_sk_from_srgb_sse2+0x1e>
+ DB 232,0,0,0,0 ; call 203c <_sk_from_srgb_sse2+0x18>
DB 88 ; pop %eax
- DB 15,40,218 ; movaps %xmm2,%xmm3
- DB 15,89,219 ; mulps %xmm3,%xmm3
- DB 15,40,160,249,105,0,0 ; movaps 0x69f9(%eax),%xmm4
+ DB 15,40,202 ; movaps %xmm2,%xmm1
+ DB 15,89,201 ; mulps %xmm1,%xmm1
+ DB 15,40,160,148,81,0,0 ; movaps 0x5194(%eax),%xmm4
DB 15,89,196 ; mulps %xmm4,%xmm0
- DB 15,40,136,9,106,0,0 ; movaps 0x6a09(%eax),%xmm1
- DB 15,41,77,200 ; movaps %xmm1,-0x38(%ebp)
- DB 15,88,193 ; addps %xmm1,%xmm0
- DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,40,152,233,105,0,0 ; movaps 0x69e9(%eax),%xmm3
+ DB 15,40,176,164,81,0,0 ; movaps 0x51a4(%eax),%xmm6
+ DB 15,41,117,216 ; movaps %xmm6,-0x28(%ebp)
+ DB 15,88,198 ; addps %xmm6,%xmm0
+ DB 15,89,193 ; mulps %xmm1,%xmm0
+ DB 15,40,176,132,81,0,0 ; movaps 0x5184(%eax),%xmm6
DB 15,40,202 ; movaps %xmm2,%xmm1
- DB 15,89,203 ; mulps %xmm3,%xmm1
- DB 15,40,184,25,106,0,0 ; movaps 0x6a19(%eax),%xmm7
- DB 15,41,125,216 ; movaps %xmm7,-0x28(%ebp)
+ DB 15,89,206 ; mulps %xmm6,%xmm1
+ DB 15,40,184,180,81,0,0 ; movaps 0x51b4(%eax),%xmm7
+ DB 15,41,125,232 ; movaps %xmm7,-0x18(%ebp)
DB 15,88,199 ; addps %xmm7,%xmm0
- DB 15,40,184,41,106,0,0 ; movaps 0x6a29(%eax),%xmm7
+ DB 15,40,184,196,81,0,0 ; movaps 0x51c4(%eax),%xmm7
DB 15,194,215,1 ; cmpltps %xmm7,%xmm2
DB 15,84,202 ; andps %xmm2,%xmm1
DB 15,85,208 ; andnps %xmm0,%xmm2
DB 15,86,209 ; orps %xmm1,%xmm2
- DB 15,40,197 ; movaps %xmm5,%xmm0
+ DB 15,40,195 ; movaps %xmm3,%xmm0
DB 15,89,192 ; mulps %xmm0,%xmm0
- DB 15,40,205 ; movaps %xmm5,%xmm1
+ DB 15,40,203 ; movaps %xmm3,%xmm1
DB 15,89,204 ; mulps %xmm4,%xmm1
- DB 15,88,77,200 ; addps -0x38(%ebp),%xmm1
+ DB 15,88,77,216 ; addps -0x28(%ebp),%xmm1
DB 15,89,200 ; mulps %xmm0,%xmm1
+ DB 15,40,195 ; movaps %xmm3,%xmm0
+ DB 15,89,198 ; mulps %xmm6,%xmm0
+ DB 15,88,77,232 ; addps -0x18(%ebp),%xmm1
+ DB 15,194,223,1 ; cmpltps %xmm7,%xmm3
+ DB 15,84,195 ; andps %xmm3,%xmm0
+ DB 15,85,217 ; andnps %xmm1,%xmm3
+ DB 15,86,216 ; orps %xmm0,%xmm3
+ DB 15,89,229 ; mulps %xmm5,%xmm4
+ DB 15,88,101,216 ; addps -0x28(%ebp),%xmm4
DB 15,40,197 ; movaps %xmm5,%xmm0
- DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,77,216 ; addps -0x28(%ebp),%xmm1
- DB 15,194,239,1 ; cmpltps %xmm7,%xmm5
- DB 15,84,197 ; andps %xmm5,%xmm0
- DB 15,85,233 ; andnps %xmm1,%xmm5
- DB 15,86,232 ; orps %xmm0,%xmm5
- DB 15,89,230 ; mulps %xmm6,%xmm4
- DB 15,88,101,200 ; addps -0x38(%ebp),%xmm4
- DB 15,40,198 ; movaps %xmm6,%xmm0
DB 15,89,192 ; mulps %xmm0,%xmm0
DB 15,89,224 ; mulps %xmm0,%xmm4
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
- DB 139,85,20 ; mov 0x14(%ebp),%edx
- DB 139,117,24 ; mov 0x18(%ebp),%esi
- DB 15,88,101,216 ; addps -0x28(%ebp),%xmm4
- DB 15,40,69,40 ; movaps 0x28(%ebp),%xmm0
- DB 15,89,222 ; mulps %xmm6,%xmm3
- DB 15,194,247,1 ; cmpltps %xmm7,%xmm6
- DB 15,40,77,56 ; movaps 0x38(%ebp),%xmm1
- DB 15,84,222 ; andps %xmm6,%xmm3
- DB 15,85,244 ; andnps %xmm4,%xmm6
- DB 15,40,101,72 ; movaps 0x48(%ebp),%xmm4
- DB 15,86,243 ; orps %xmm3,%xmm6
- DB 15,40,93,88 ; movaps 0x58(%ebp),%xmm3
- DB 139,125,12 ; mov 0xc(%ebp),%edi
- DB 141,95,4 ; lea 0x4(%edi),%ebx
- DB 15,41,92,36,80 ; movaps %xmm3,0x50(%esp)
- DB 15,41,100,36,64 ; movaps %xmm4,0x40(%esp)
- DB 15,41,76,36,48 ; movaps %xmm1,0x30(%esp)
- DB 15,41,68,36,32 ; movaps %xmm0,0x20(%esp)
- DB 137,116,36,16 ; mov %esi,0x10(%esp)
- DB 137,84,36,12 ; mov %edx,0xc(%esp)
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
+ DB 15,88,101,232 ; addps -0x18(%ebp),%xmm4
+ DB 15,89,245 ; mulps %xmm5,%xmm6
+ DB 15,194,239,1 ; cmpltps %xmm7,%xmm5
+ DB 15,84,245 ; andps %xmm5,%xmm6
+ DB 15,85,236 ; andnps %xmm4,%xmm5
+ DB 15,86,238 ; orps %xmm6,%xmm5
+ DB 139,69,12 ; mov 0xc(%ebp),%eax
+ DB 141,72,4 ; lea 0x4(%eax),%ecx
+ DB 131,236,8 ; sub $0x8,%esp
DB 15,40,194 ; movaps %xmm2,%xmm0
- DB 15,40,205 ; movaps %xmm5,%xmm1
- DB 15,40,214 ; movaps %xmm6,%xmm2
- DB 15,40,93,184 ; movaps -0x48(%ebp),%xmm3
- DB 255,23 ; call *(%edi)
- DB 129,196,156,0,0,0 ; add $0x9c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 15,40,203 ; movaps %xmm3,%xmm1
+ DB 15,40,213 ; movaps %xmm5,%xmm2
+ DB 15,40,93,200 ; movaps -0x38(%ebp),%xmm3
+ DB 81 ; push %ecx
+ DB 255,117,8 ; pushl 0x8(%ebp)
+ DB 255,16 ; call *(%eax)
+ DB 131,196,72 ; add $0x48,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -39772,87 +38937,73 @@ PUBLIC _sk_from_srgb_dst_sse2
_sk_from_srgb_dst_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 129,236,188,0,0,0 ; sub $0xbc,%esp
- DB 15,41,93,152 ; movaps %xmm3,-0x68(%ebp)
- DB 15,41,85,168 ; movaps %xmm2,-0x58(%ebp)
- DB 15,41,77,184 ; movaps %xmm1,-0x48(%ebp)
- DB 15,41,69,200 ; movaps %xmm0,-0x38(%ebp)
- DB 232,0,0,0,0 ; call 2bda <_sk_from_srgb_dst_sse2+0x21>
- DB 88 ; pop %eax
- DB 15,40,77,40 ; movaps 0x28(%ebp),%xmm1
- DB 15,40,193 ; movaps %xmm1,%xmm0
- DB 15,89,192 ; mulps %xmm0,%xmm0
- DB 15,40,168,38,105,0,0 ; movaps 0x6926(%eax),%xmm5
- DB 15,40,249 ; movaps %xmm1,%xmm7
- DB 15,89,253 ; mulps %xmm5,%xmm7
- DB 15,40,144,54,105,0,0 ; movaps 0x6936(%eax),%xmm2
- DB 15,41,85,216 ; movaps %xmm2,-0x28(%ebp)
- DB 15,88,250 ; addps %xmm2,%xmm7
- DB 15,89,248 ; mulps %xmm0,%xmm7
- DB 15,40,176,22,105,0,0 ; movaps 0x6916(%eax),%xmm6
- DB 15,40,225 ; movaps %xmm1,%xmm4
- DB 15,89,230 ; mulps %xmm6,%xmm4
- DB 15,40,152,70,105,0,0 ; movaps 0x6946(%eax),%xmm3
- DB 15,88,251 ; addps %xmm3,%xmm7
- DB 15,40,144,86,105,0,0 ; movaps 0x6956(%eax),%xmm2
- DB 15,194,202,1 ; cmpltps %xmm2,%xmm1
- DB 15,84,225 ; andps %xmm1,%xmm4
- DB 15,85,207 ; andnps %xmm7,%xmm1
- DB 15,86,204 ; orps %xmm4,%xmm1
- DB 15,40,69,56 ; movaps 0x38(%ebp),%xmm0
- DB 15,40,224 ; movaps %xmm0,%xmm4
- DB 15,89,228 ; mulps %xmm4,%xmm4
- DB 15,40,248 ; movaps %xmm0,%xmm7
- DB 15,89,253 ; mulps %xmm5,%xmm7
- DB 15,88,125,216 ; addps -0x28(%ebp),%xmm7
- DB 15,89,252 ; mulps %xmm4,%xmm7
- DB 15,40,224 ; movaps %xmm0,%xmm4
- DB 15,89,230 ; mulps %xmm6,%xmm4
- DB 15,88,251 ; addps %xmm3,%xmm7
- DB 15,194,194,1 ; cmpltps %xmm2,%xmm0
- DB 15,84,224 ; andps %xmm0,%xmm4
- DB 15,85,199 ; andnps %xmm7,%xmm0
- DB 15,86,196 ; orps %xmm4,%xmm0
- DB 15,40,101,72 ; movaps 0x48(%ebp),%xmm4
- DB 15,89,236 ; mulps %xmm4,%xmm5
- DB 15,88,109,216 ; addps -0x28(%ebp),%xmm5
- DB 15,40,252 ; movaps %xmm4,%xmm7
- DB 15,89,255 ; mulps %xmm7,%xmm7
- DB 15,89,239 ; mulps %xmm7,%xmm5
- DB 15,88,235 ; addps %xmm3,%xmm5
- DB 15,89,244 ; mulps %xmm4,%xmm6
- DB 15,194,226,1 ; cmpltps %xmm2,%xmm4
- DB 15,84,244 ; andps %xmm4,%xmm6
- DB 15,85,229 ; andnps %xmm5,%xmm4
+ DB 131,236,72 ; sub $0x48,%esp
+ DB 15,41,93,184 ; movaps %xmm3,-0x48(%ebp)
+ DB 15,41,85,200 ; movaps %xmm2,-0x38(%ebp)
+ DB 15,41,77,216 ; movaps %xmm1,-0x28(%ebp)
+ DB 15,41,69,232 ; movaps %xmm0,-0x18(%ebp)
+ DB 232,0,0,0,0 ; call 2117 <_sk_from_srgb_dst_sse2+0x1b>
+ DB 89 ; pop %ecx
DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
- DB 139,85,20 ; mov 0x14(%ebp),%edx
- DB 139,117,24 ; mov 0x18(%ebp),%esi
- DB 15,86,230 ; orps %xmm6,%xmm4
- DB 15,40,85,88 ; movaps 0x58(%ebp),%xmm2
- DB 139,125,12 ; mov 0xc(%ebp),%edi
- DB 141,95,4 ; lea 0x4(%edi),%ebx
- DB 15,41,84,36,80 ; movaps %xmm2,0x50(%esp)
- DB 137,116,36,16 ; mov %esi,0x10(%esp)
- DB 137,84,36,12 ; mov %edx,0xc(%esp)
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
- DB 15,41,100,36,64 ; movaps %xmm4,0x40(%esp)
- DB 15,41,68,36,48 ; movaps %xmm0,0x30(%esp)
- DB 15,41,76,36,32 ; movaps %xmm1,0x20(%esp)
- DB 15,40,69,200 ; movaps -0x38(%ebp),%xmm0
- DB 15,40,77,184 ; movaps -0x48(%ebp),%xmm1
- DB 15,40,85,168 ; movaps -0x58(%ebp),%xmm2
- DB 15,40,93,152 ; movaps -0x68(%ebp),%xmm3
- DB 255,23 ; call *(%edi)
- DB 129,196,188,0,0,0 ; add $0xbc,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 15,40,72,16 ; movaps 0x10(%eax),%xmm1
+ DB 15,40,233 ; movaps %xmm1,%xmm5
+ DB 15,89,237 ; mulps %xmm5,%xmm5
+ DB 15,40,161,9,81,0,0 ; movaps 0x5109(%ecx),%xmm4
+ DB 15,40,193 ; movaps %xmm1,%xmm0
+ DB 15,89,196 ; mulps %xmm4,%xmm0
+ DB 15,40,177,25,81,0,0 ; movaps 0x5119(%ecx),%xmm6
+ DB 15,88,198 ; addps %xmm6,%xmm0
+ DB 15,89,197 ; mulps %xmm5,%xmm0
+ DB 15,40,169,249,80,0,0 ; movaps 0x50f9(%ecx),%xmm5
+ DB 15,40,209 ; movaps %xmm1,%xmm2
+ DB 15,89,213 ; mulps %xmm5,%xmm2
+ DB 15,40,185,41,81,0,0 ; movaps 0x5129(%ecx),%xmm7
+ DB 15,88,199 ; addps %xmm7,%xmm0
+ DB 15,40,153,57,81,0,0 ; movaps 0x5139(%ecx),%xmm3
+ DB 15,194,203,1 ; cmpltps %xmm3,%xmm1
+ DB 15,84,209 ; andps %xmm1,%xmm2
+ DB 15,85,200 ; andnps %xmm0,%xmm1
+ DB 15,86,202 ; orps %xmm2,%xmm1
+ DB 15,41,72,16 ; movaps %xmm1,0x10(%eax)
+ DB 15,40,64,32 ; movaps 0x20(%eax),%xmm0
+ DB 15,40,200 ; movaps %xmm0,%xmm1
+ DB 15,89,201 ; mulps %xmm1,%xmm1
+ DB 15,40,208 ; movaps %xmm0,%xmm2
+ DB 15,89,212 ; mulps %xmm4,%xmm2
+ DB 15,88,214 ; addps %xmm6,%xmm2
+ DB 15,89,209 ; mulps %xmm1,%xmm2
+ DB 15,40,200 ; movaps %xmm0,%xmm1
+ DB 15,89,205 ; mulps %xmm5,%xmm1
+ DB 15,88,215 ; addps %xmm7,%xmm2
+ DB 15,194,195,1 ; cmpltps %xmm3,%xmm0
+ DB 15,84,200 ; andps %xmm0,%xmm1
+ DB 15,85,194 ; andnps %xmm2,%xmm0
+ DB 15,86,193 ; orps %xmm1,%xmm0
+ DB 15,41,64,32 ; movaps %xmm0,0x20(%eax)
+ DB 15,40,64,48 ; movaps 0x30(%eax),%xmm0
+ DB 15,89,224 ; mulps %xmm0,%xmm4
+ DB 15,88,230 ; addps %xmm6,%xmm4
+ DB 15,40,200 ; movaps %xmm0,%xmm1
+ DB 15,89,201 ; mulps %xmm1,%xmm1
+ DB 15,89,225 ; mulps %xmm1,%xmm4
+ DB 15,88,231 ; addps %xmm7,%xmm4
+ DB 15,89,232 ; mulps %xmm0,%xmm5
+ DB 15,194,195,1 ; cmpltps %xmm3,%xmm0
+ DB 15,84,232 ; andps %xmm0,%xmm5
+ DB 15,85,196 ; andnps %xmm4,%xmm0
+ DB 15,86,197 ; orps %xmm5,%xmm0
+ DB 15,41,64,48 ; movaps %xmm0,0x30(%eax)
+ DB 139,77,12 ; mov 0xc(%ebp),%ecx
+ DB 141,81,4 ; lea 0x4(%ecx),%edx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 15,40,69,232 ; movaps -0x18(%ebp),%xmm0
+ DB 15,40,77,216 ; movaps -0x28(%ebp),%xmm1
+ DB 15,40,85,200 ; movaps -0x38(%ebp),%xmm2
+ DB 15,40,93,184 ; movaps -0x48(%ebp),%xmm3
+ DB 82 ; push %edx
+ DB 80 ; push %eax
+ DB 255,17 ; call *(%ecx)
+ DB 131,196,88 ; add $0x58,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -39860,36 +39011,33 @@ PUBLIC _sk_to_srgb_sse2
_sk_to_srgb_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 129,236,172,0,0,0 ; sub $0xac,%esp
- DB 15,41,93,168 ; movaps %xmm3,-0x58(%ebp)
+ DB 131,236,72 ; sub $0x48,%esp
+ DB 15,41,93,184 ; movaps %xmm3,-0x48(%ebp)
DB 15,40,250 ; movaps %xmm2,%xmm7
DB 15,40,241 ; movaps %xmm1,%xmm6
DB 15,40,208 ; movaps %xmm0,%xmm2
- DB 232,0,0,0,0 ; call 2cfa <_sk_to_srgb_sse2+0x1e>
+ DB 232,0,0,0,0 ; call 2202 <_sk_to_srgb_sse2+0x18>
DB 88 ; pop %eax
DB 15,82,218 ; rsqrtps %xmm2,%xmm3
- DB 15,40,160,86,104,0,0 ; movaps 0x6856(%eax),%xmm4
+ DB 15,40,160,110,80,0,0 ; movaps 0x506e(%eax),%xmm4
DB 15,40,235 ; movaps %xmm3,%xmm5
DB 15,89,236 ; mulps %xmm4,%xmm5
- DB 15,40,128,102,104,0,0 ; movaps 0x6866(%eax),%xmm0
- DB 15,41,69,216 ; movaps %xmm0,-0x28(%ebp)
+ DB 15,40,128,126,80,0,0 ; movaps 0x507e(%eax),%xmm0
+ DB 15,41,69,232 ; movaps %xmm0,-0x18(%ebp)
DB 15,88,232 ; addps %xmm0,%xmm5
DB 15,89,235 ; mulps %xmm3,%xmm5
- DB 15,40,128,118,104,0,0 ; movaps 0x6876(%eax),%xmm0
- DB 15,41,69,184 ; movaps %xmm0,-0x48(%ebp)
- DB 15,88,232 ; addps %xmm0,%xmm5
- DB 15,40,128,134,104,0,0 ; movaps 0x6886(%eax),%xmm0
+ DB 15,40,128,142,80,0,0 ; movaps 0x508e(%eax),%xmm0
DB 15,41,69,200 ; movaps %xmm0,-0x38(%ebp)
+ DB 15,88,232 ; addps %xmm0,%xmm5
+ DB 15,40,128,158,80,0,0 ; movaps 0x509e(%eax),%xmm0
+ DB 15,41,69,216 ; movaps %xmm0,-0x28(%ebp)
DB 15,88,216 ; addps %xmm0,%xmm3
DB 15,83,195 ; rcpps %xmm3,%xmm0
DB 15,89,197 ; mulps %xmm5,%xmm0
- DB 15,40,168,70,104,0,0 ; movaps 0x6846(%eax),%xmm5
+ DB 15,40,168,94,80,0,0 ; movaps 0x505e(%eax),%xmm5
DB 15,40,202 ; movaps %xmm2,%xmm1
DB 15,89,205 ; mulps %xmm5,%xmm1
- DB 15,40,152,150,104,0,0 ; movaps 0x6896(%eax),%xmm3
+ DB 15,40,152,174,80,0,0 ; movaps 0x50ae(%eax),%xmm3
DB 15,194,211,1 ; cmpltps %xmm3,%xmm2
DB 15,84,202 ; andps %xmm2,%xmm1
DB 15,85,208 ; andnps %xmm0,%xmm2
@@ -39897,10 +39045,10 @@ _sk_to_srgb_sse2 LABEL PROC
DB 15,82,198 ; rsqrtps %xmm6,%xmm0
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,89,204 ; mulps %xmm4,%xmm1
- DB 15,88,77,216 ; addps -0x28(%ebp),%xmm1
+ DB 15,88,77,232 ; addps -0x18(%ebp),%xmm1
DB 15,89,200 ; mulps %xmm0,%xmm1
- DB 15,88,77,184 ; addps -0x48(%ebp),%xmm1
- DB 15,88,69,200 ; addps -0x38(%ebp),%xmm0
+ DB 15,88,77,200 ; addps -0x38(%ebp),%xmm1
+ DB 15,88,69,216 ; addps -0x28(%ebp),%xmm0
DB 15,83,192 ; rcpps %xmm0,%xmm0
DB 15,89,193 ; mulps %xmm1,%xmm0
DB 15,40,206 ; movaps %xmm6,%xmm1
@@ -39911,45 +39059,28 @@ _sk_to_srgb_sse2 LABEL PROC
DB 15,86,241 ; orps %xmm1,%xmm6
DB 15,82,199 ; rsqrtps %xmm7,%xmm0
DB 15,89,224 ; mulps %xmm0,%xmm4
- DB 15,88,101,216 ; addps -0x28(%ebp),%xmm4
+ DB 15,88,101,232 ; addps -0x18(%ebp),%xmm4
DB 15,89,224 ; mulps %xmm0,%xmm4
- DB 15,88,101,184 ; addps -0x48(%ebp),%xmm4
- DB 15,88,69,200 ; addps -0x38(%ebp),%xmm0
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
- DB 139,85,20 ; mov 0x14(%ebp),%edx
- DB 139,117,24 ; mov 0x18(%ebp),%esi
+ DB 15,88,101,200 ; addps -0x38(%ebp),%xmm4
+ DB 15,88,69,216 ; addps -0x28(%ebp),%xmm0
DB 15,83,192 ; rcpps %xmm0,%xmm0
DB 15,89,196 ; mulps %xmm4,%xmm0
- DB 15,40,77,40 ; movaps 0x28(%ebp),%xmm1
DB 15,89,239 ; mulps %xmm7,%xmm5
DB 15,194,251,1 ; cmpltps %xmm3,%xmm7
- DB 15,40,93,56 ; movaps 0x38(%ebp),%xmm3
DB 15,84,239 ; andps %xmm7,%xmm5
DB 15,85,248 ; andnps %xmm0,%xmm7
- DB 15,40,69,72 ; movaps 0x48(%ebp),%xmm0
DB 15,86,253 ; orps %xmm5,%xmm7
- DB 15,40,101,88 ; movaps 0x58(%ebp),%xmm4
- DB 139,125,12 ; mov 0xc(%ebp),%edi
- DB 141,95,4 ; lea 0x4(%edi),%ebx
- DB 15,41,100,36,80 ; movaps %xmm4,0x50(%esp)
- DB 15,41,68,36,64 ; movaps %xmm0,0x40(%esp)
- DB 15,41,92,36,48 ; movaps %xmm3,0x30(%esp)
- DB 15,41,76,36,32 ; movaps %xmm1,0x20(%esp)
- DB 137,116,36,16 ; mov %esi,0x10(%esp)
- DB 137,84,36,12 ; mov %edx,0xc(%esp)
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
+ DB 139,69,12 ; mov 0xc(%ebp),%eax
+ DB 141,72,4 ; lea 0x4(%eax),%ecx
+ DB 131,236,8 ; sub $0x8,%esp
DB 15,40,194 ; movaps %xmm2,%xmm0
DB 15,40,206 ; movaps %xmm6,%xmm1
DB 15,40,215 ; movaps %xmm7,%xmm2
- DB 15,40,93,168 ; movaps -0x58(%ebp),%xmm3
- DB 255,23 ; call *(%edi)
- DB 129,196,172,0,0,0 ; add $0xac,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 15,40,93,184 ; movaps -0x48(%ebp),%xmm3
+ DB 81 ; push %ecx
+ DB 255,117,8 ; pushl 0x8(%ebp)
+ DB 255,16 ; call *(%eax)
+ DB 131,196,88 ; add $0x58,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -39957,92 +39088,74 @@ PUBLIC _sk_rgb_to_hsl_sse2
_sk_rgb_to_hsl_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 129,236,156,0,0,0 ; sub $0x9c,%esp
- DB 15,41,93,184 ; movaps %xmm3,-0x48(%ebp)
- DB 15,40,233 ; movaps %xmm1,%xmm5
+ DB 131,236,56 ; sub $0x38,%esp
+ DB 15,41,93,200 ; movaps %xmm3,-0x38(%ebp)
+ DB 15,40,249 ; movaps %xmm1,%xmm7
DB 15,40,224 ; movaps %xmm0,%xmm4
- DB 232,0,0,0,0 ; call 2e39 <_sk_rgb_to_hsl_sse2+0x1b>
+ DB 232,0,0,0,0 ; call 22f9 <_sk_rgb_to_hsl_sse2+0x15>
DB 88 ; pop %eax
DB 15,40,204 ; movaps %xmm4,%xmm1
- DB 15,95,205 ; maxps %xmm5,%xmm1
+ DB 15,95,207 ; maxps %xmm7,%xmm1
DB 15,95,202 ; maxps %xmm2,%xmm1
- DB 15,40,252 ; movaps %xmm4,%xmm7
- DB 15,93,253 ; minps %xmm5,%xmm7
- DB 15,41,109,216 ; movaps %xmm5,-0x28(%ebp)
- DB 15,93,250 ; minps %xmm2,%xmm7
+ DB 15,40,220 ; movaps %xmm4,%xmm3
+ DB 15,93,223 ; minps %xmm7,%xmm3
+ DB 15,93,218 ; minps %xmm2,%xmm3
+ DB 15,41,93,232 ; movaps %xmm3,-0x18(%ebp)
DB 15,40,193 ; movaps %xmm1,%xmm0
- DB 15,92,199 ; subps %xmm7,%xmm0
- DB 15,41,69,200 ; movaps %xmm0,-0x38(%ebp)
- DB 15,40,152,103,103,0,0 ; movaps 0x6767(%eax),%xmm3
+ DB 15,92,195 ; subps %xmm3,%xmm0
+ DB 15,41,69,216 ; movaps %xmm0,-0x28(%ebp)
+ DB 15,40,152,199,79,0,0 ; movaps 0x4fc7(%eax),%xmm3
DB 15,94,216 ; divps %xmm0,%xmm3
- DB 15,40,197 ; movaps %xmm5,%xmm0
+ DB 15,40,199 ; movaps %xmm7,%xmm0
DB 15,92,194 ; subps %xmm2,%xmm0
DB 15,89,195 ; mulps %xmm3,%xmm0
+ DB 15,40,239 ; movaps %xmm7,%xmm5
DB 15,194,234,1 ; cmpltps %xmm2,%xmm5
- DB 15,84,168,119,103,0,0 ; andps 0x6777(%eax),%xmm5
+ DB 15,84,168,215,79,0,0 ; andps 0x4fd7(%eax),%xmm5
DB 15,88,232 ; addps %xmm0,%xmm5
DB 15,40,193 ; movaps %xmm1,%xmm0
DB 15,194,196,0 ; cmpeqps %xmm4,%xmm0
DB 15,40,241 ; movaps %xmm1,%xmm6
- DB 15,194,117,216,0 ; cmpeqps -0x28(%ebp),%xmm6
+ DB 15,194,247,0 ; cmpeqps %xmm7,%xmm6
DB 15,92,212 ; subps %xmm4,%xmm2
- DB 15,92,101,216 ; subps -0x28(%ebp),%xmm4
+ DB 15,92,231 ; subps %xmm7,%xmm4
DB 15,89,211 ; mulps %xmm3,%xmm2
DB 15,89,227 ; mulps %xmm3,%xmm4
- DB 15,40,152,135,103,0,0 ; movaps 0x6787(%eax),%xmm3
+ DB 15,40,152,231,79,0,0 ; movaps 0x4fe7(%eax),%xmm3
DB 15,88,211 ; addps %xmm3,%xmm2
- DB 15,88,160,151,103,0,0 ; addps 0x6797(%eax),%xmm4
+ DB 15,88,160,247,79,0,0 ; addps 0x4ff7(%eax),%xmm4
DB 15,84,214 ; andps %xmm6,%xmm2
DB 15,85,244 ; andnps %xmm4,%xmm6
DB 15,86,242 ; orps %xmm2,%xmm6
- DB 139,77,8 ; mov 0x8(%ebp),%ecx
- DB 139,85,16 ; mov 0x10(%ebp),%edx
- DB 139,117,20 ; mov 0x14(%ebp),%esi
- DB 139,125,24 ; mov 0x18(%ebp),%edi
DB 15,84,232 ; andps %xmm0,%xmm5
DB 15,85,198 ; andnps %xmm6,%xmm0
DB 15,86,197 ; orps %xmm5,%xmm0
DB 15,40,225 ; movaps %xmm1,%xmm4
- DB 15,194,231,4 ; cmpneqps %xmm7,%xmm4
+ DB 15,40,85,232 ; movaps -0x18(%ebp),%xmm2
+ DB 15,194,226,4 ; cmpneqps %xmm2,%xmm4
DB 15,92,217 ; subps %xmm1,%xmm3
- DB 15,88,207 ; addps %xmm7,%xmm1
- DB 15,40,168,183,103,0,0 ; movaps 0x67b7(%eax),%xmm5
- DB 15,92,223 ; subps %xmm7,%xmm3
+ DB 15,88,202 ; addps %xmm2,%xmm1
+ DB 15,40,168,23,80,0,0 ; movaps 0x5017(%eax),%xmm5
+ DB 15,92,218 ; subps %xmm2,%xmm3
DB 15,40,209 ; movaps %xmm1,%xmm2
DB 15,89,213 ; mulps %xmm5,%xmm2
DB 15,194,234,1 ; cmpltps %xmm2,%xmm5
DB 15,84,221 ; andps %xmm5,%xmm3
DB 15,85,233 ; andnps %xmm1,%xmm5
- DB 15,40,117,40 ; movaps 0x28(%ebp),%xmm6
DB 15,86,235 ; orps %xmm3,%xmm5
- DB 15,40,93,56 ; movaps 0x38(%ebp),%xmm3
- DB 15,40,77,200 ; movaps -0x38(%ebp),%xmm1
+ DB 15,40,77,216 ; movaps -0x28(%ebp),%xmm1
DB 15,94,205 ; divps %xmm5,%xmm1
- DB 15,40,109,72 ; movaps 0x48(%ebp),%xmm5
- DB 15,89,128,167,103,0,0 ; mulps 0x67a7(%eax),%xmm0
+ DB 15,89,128,7,80,0,0 ; mulps 0x5007(%eax),%xmm0
DB 15,84,196 ; andps %xmm4,%xmm0
DB 15,84,204 ; andps %xmm4,%xmm1
- DB 15,40,101,88 ; movaps 0x58(%ebp),%xmm4
DB 139,69,12 ; mov 0xc(%ebp),%eax
- DB 141,88,4 ; lea 0x4(%eax),%ebx
- DB 15,41,100,36,80 ; movaps %xmm4,0x50(%esp)
- DB 15,41,108,36,64 ; movaps %xmm5,0x40(%esp)
- DB 15,41,92,36,48 ; movaps %xmm3,0x30(%esp)
- DB 15,41,116,36,32 ; movaps %xmm6,0x20(%esp)
- DB 137,124,36,16 ; mov %edi,0x10(%esp)
- DB 137,116,36,12 ; mov %esi,0xc(%esp)
- DB 137,84,36,8 ; mov %edx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,12,36 ; mov %ecx,(%esp)
- DB 15,40,93,184 ; movaps -0x48(%ebp),%xmm3
+ DB 141,72,4 ; lea 0x4(%eax),%ecx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 15,40,93,200 ; movaps -0x38(%ebp),%xmm3
+ DB 81 ; push %ecx
+ DB 255,117,8 ; pushl 0x8(%ebp)
DB 255,16 ; call *(%eax)
- DB 129,196,156,0,0,0 ; add $0x9c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 131,196,72 ; add $0x48,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -40050,180 +39163,159 @@ PUBLIC _sk_hsl_to_rgb_sse2
_sk_hsl_to_rgb_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 129,236,44,1,0,0 ; sub $0x12c,%esp
- DB 15,41,157,40,255,255,255 ; movaps %xmm3,-0xd8(%ebp)
- DB 15,41,69,200 ; movaps %xmm0,-0x38(%ebp)
- DB 232,0,0,0,0 ; call 2f6e <_sk_hsl_to_rgb_sse2+0x1c>
+ DB 129,236,200,0,0,0 ; sub $0xc8,%esp
+ DB 15,41,157,56,255,255,255 ; movaps %xmm3,-0xc8(%ebp)
+ DB 15,41,69,184 ; movaps %xmm0,-0x48(%ebp)
+ DB 232,0,0,0,0 ; call 23ee <_sk_hsl_to_rgb_sse2+0x19>
DB 88 ; pop %eax
- DB 15,40,152,146,102,0,0 ; movaps 0x6692(%eax),%xmm3
- DB 15,40,227 ; movaps %xmm3,%xmm4
- DB 15,40,243 ; movaps %xmm3,%xmm6
- DB 15,41,181,72,255,255,255 ; movaps %xmm6,-0xb8(%ebp)
- DB 15,194,226,2 ; cmpleps %xmm2,%xmm4
- DB 15,40,233 ; movaps %xmm1,%xmm5
- DB 15,87,219 ; xorps %xmm3,%xmm3
- DB 15,194,217,0 ; cmpeqps %xmm1,%xmm3
- DB 15,41,93,216 ; movaps %xmm3,-0x28(%ebp)
+ DB 15,40,160,50,79,0,0 ; movaps 0x4f32(%eax),%xmm4
+ DB 15,40,220 ; movaps %xmm4,%xmm3
+ DB 15,41,165,104,255,255,255 ; movaps %xmm4,-0x98(%ebp)
+ DB 15,194,218,2 ; cmpleps %xmm2,%xmm3
+ DB 15,40,241 ; movaps %xmm1,%xmm6
+ DB 15,87,237 ; xorps %xmm5,%xmm5
+ DB 15,194,233,0 ; cmpeqps %xmm1,%xmm5
+ DB 15,41,109,232 ; movaps %xmm5,-0x18(%ebp)
DB 15,89,202 ; mulps %xmm2,%xmm1
- DB 15,92,233 ; subps %xmm1,%xmm5
- DB 15,84,236 ; andps %xmm4,%xmm5
- DB 15,85,225 ; andnps %xmm1,%xmm4
- DB 15,86,229 ; orps %xmm5,%xmm4
- DB 15,40,136,162,102,0,0 ; movaps 0x66a2(%eax),%xmm1
- DB 15,88,200 ; addps %xmm0,%xmm1
- DB 243,15,91,193 ; cvttps2dq %xmm1,%xmm0
- DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,40,217 ; movaps %xmm1,%xmm3
- DB 15,194,216,1 ; cmpltps %xmm0,%xmm3
- DB 15,40,168,178,102,0,0 ; movaps 0x66b2(%eax),%xmm5
- DB 15,41,173,104,255,255,255 ; movaps %xmm5,-0x98(%ebp)
- DB 15,84,221 ; andps %xmm5,%xmm3
- DB 15,92,195 ; subps %xmm3,%xmm0
- DB 15,92,200 ; subps %xmm0,%xmm1
- DB 15,40,234 ; movaps %xmm2,%xmm5
- DB 15,41,173,56,255,255,255 ; movaps %xmm5,-0xc8(%ebp)
- DB 15,88,229 ; addps %xmm5,%xmm4
- DB 15,41,101,184 ; movaps %xmm4,-0x48(%ebp)
- DB 15,88,237 ; addps %xmm5,%xmm5
- DB 15,92,236 ; subps %xmm4,%xmm5
- DB 15,40,144,194,102,0,0 ; movaps 0x66c2(%eax),%xmm2
- DB 15,41,85,168 ; movaps %xmm2,-0x58(%ebp)
- DB 15,194,209,2 ; cmpleps %xmm1,%xmm2
- DB 15,92,229 ; subps %xmm5,%xmm4
- DB 15,40,198 ; movaps %xmm6,%xmm0
- DB 15,194,193,2 ; cmpleps %xmm1,%xmm0
- DB 15,40,176,242,102,0,0 ; movaps 0x66f2(%eax),%xmm6
- DB 15,41,181,88,255,255,255 ; movaps %xmm6,-0xa8(%ebp)
- DB 15,194,241,2 ; cmpleps %xmm1,%xmm6
- DB 15,40,152,210,102,0,0 ; movaps 0x66d2(%eax),%xmm3
- DB 15,41,93,152 ; movaps %xmm3,-0x68(%ebp)
- DB 15,89,203 ; mulps %xmm3,%xmm1
- DB 15,40,184,226,102,0,0 ; movaps 0x66e2(%eax),%xmm7
- DB 15,41,125,136 ; movaps %xmm7,-0x78(%ebp)
- DB 15,92,249 ; subps %xmm1,%xmm7
- DB 15,89,252 ; mulps %xmm4,%xmm7
- DB 15,88,253 ; addps %xmm5,%xmm7
- DB 15,40,221 ; movaps %xmm5,%xmm3
- DB 15,84,218 ; andps %xmm2,%xmm3
- DB 15,85,215 ; andnps %xmm7,%xmm2
- DB 15,86,211 ; orps %xmm3,%xmm2
- DB 15,84,208 ; andps %xmm0,%xmm2
- DB 15,85,69,184 ; andnps -0x48(%ebp),%xmm0
- DB 15,86,194 ; orps %xmm2,%xmm0
- DB 15,89,204 ; mulps %xmm4,%xmm1
- DB 15,88,205 ; addps %xmm5,%xmm1
+ DB 15,92,241 ; subps %xmm1,%xmm6
+ DB 15,84,243 ; andps %xmm3,%xmm6
+ DB 15,85,217 ; andnps %xmm1,%xmm3
+ DB 15,86,222 ; orps %xmm6,%xmm3
+ DB 15,40,168,66,79,0,0 ; movaps 0x4f42(%eax),%xmm5
+ DB 15,88,232 ; addps %xmm0,%xmm5
+ DB 243,15,91,205 ; cvttps2dq %xmm5,%xmm1
+ DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
+ DB 15,40,197 ; movaps %xmm5,%xmm0
+ DB 15,194,193,1 ; cmpltps %xmm1,%xmm0
+ DB 15,40,176,82,79,0,0 ; movaps 0x4f52(%eax),%xmm6
+ DB 15,41,117,136 ; movaps %xmm6,-0x78(%ebp)
DB 15,84,198 ; andps %xmm6,%xmm0
- DB 15,85,241 ; andnps %xmm1,%xmm6
- DB 15,86,240 ; orps %xmm0,%xmm6
- DB 15,40,69,216 ; movaps -0x28(%ebp),%xmm0
- DB 15,85,198 ; andnps %xmm6,%xmm0
- DB 15,41,133,120,255,255,255 ; movaps %xmm0,-0x88(%ebp)
- DB 15,40,85,200 ; movaps -0x38(%ebp),%xmm2
- DB 243,15,91,194 ; cvttps2dq %xmm2,%xmm0
+ DB 15,92,200 ; subps %xmm0,%xmm1
+ DB 15,92,233 ; subps %xmm1,%xmm5
+ DB 15,41,149,72,255,255,255 ; movaps %xmm2,-0xb8(%ebp)
+ DB 15,88,218 ; addps %xmm2,%xmm3
+ DB 15,41,93,216 ; movaps %xmm3,-0x28(%ebp)
+ DB 15,88,210 ; addps %xmm2,%xmm2
+ DB 15,92,211 ; subps %xmm3,%xmm2
+ DB 15,40,184,98,79,0,0 ; movaps 0x4f62(%eax),%xmm7
+ DB 15,41,189,88,255,255,255 ; movaps %xmm7,-0xa8(%ebp)
+ DB 15,194,253,2 ; cmpleps %xmm5,%xmm7
+ DB 15,92,218 ; subps %xmm2,%xmm3
+ DB 15,41,93,200 ; movaps %xmm3,-0x38(%ebp)
+ DB 15,40,204 ; movaps %xmm4,%xmm1
+ DB 15,194,205,2 ; cmpleps %xmm5,%xmm1
+ DB 15,40,160,146,79,0,0 ; movaps 0x4f92(%eax),%xmm4
+ DB 15,41,165,120,255,255,255 ; movaps %xmm4,-0x88(%ebp)
+ DB 15,194,229,2 ; cmpleps %xmm5,%xmm4
+ DB 15,40,176,114,79,0,0 ; movaps 0x4f72(%eax),%xmm6
+ DB 15,89,238 ; mulps %xmm6,%xmm5
+ DB 15,40,128,130,79,0,0 ; movaps 0x4f82(%eax),%xmm0
+ DB 15,41,69,168 ; movaps %xmm0,-0x58(%ebp)
+ DB 15,92,197 ; subps %xmm5,%xmm0
+ DB 15,89,195 ; mulps %xmm3,%xmm0
+ DB 15,88,194 ; addps %xmm2,%xmm0
+ DB 15,40,218 ; movaps %xmm2,%xmm3
+ DB 15,84,223 ; andps %xmm7,%xmm3
+ DB 15,85,248 ; andnps %xmm0,%xmm7
+ DB 15,86,251 ; orps %xmm3,%xmm7
+ DB 15,84,249 ; andps %xmm1,%xmm7
+ DB 15,85,77,216 ; andnps -0x28(%ebp),%xmm1
+ DB 15,86,207 ; orps %xmm7,%xmm1
+ DB 15,40,125,200 ; movaps -0x38(%ebp),%xmm7
+ DB 15,89,239 ; mulps %xmm7,%xmm5
+ DB 15,88,234 ; addps %xmm2,%xmm5
+ DB 15,84,204 ; andps %xmm4,%xmm1
+ DB 15,85,229 ; andnps %xmm5,%xmm4
+ DB 15,86,225 ; orps %xmm1,%xmm4
+ DB 15,40,69,232 ; movaps -0x18(%ebp),%xmm0
+ DB 15,85,196 ; andnps %xmm4,%xmm0
+ DB 15,41,69,152 ; movaps %xmm0,-0x68(%ebp)
+ DB 15,40,93,184 ; movaps -0x48(%ebp),%xmm3
+ DB 243,15,91,195 ; cvttps2dq %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,40,202 ; movaps %xmm2,%xmm1
+ DB 15,40,203 ; movaps %xmm3,%xmm1
DB 15,194,200,1 ; cmpltps %xmm0,%xmm1
- DB 15,84,136,178,102,0,0 ; andps 0x66b2(%eax),%xmm1
+ DB 15,84,136,82,79,0,0 ; andps 0x4f52(%eax),%xmm1
DB 15,92,193 ; subps %xmm1,%xmm0
- DB 15,40,202 ; movaps %xmm2,%xmm1
+ DB 15,40,203 ; movaps %xmm3,%xmm1
DB 15,92,200 ; subps %xmm0,%xmm1
- DB 15,40,128,194,102,0,0 ; movaps 0x66c2(%eax),%xmm0
+ DB 15,40,128,98,79,0,0 ; movaps 0x4f62(%eax),%xmm0
DB 15,194,193,2 ; cmpleps %xmm1,%xmm0
- DB 15,40,144,146,102,0,0 ; movaps 0x6692(%eax),%xmm2
- DB 15,194,209,2 ; cmpleps %xmm1,%xmm2
- DB 15,40,152,242,102,0,0 ; movaps 0x66f2(%eax),%xmm3
+ DB 15,40,152,50,79,0,0 ; movaps 0x4f32(%eax),%xmm3
DB 15,194,217,2 ; cmpleps %xmm1,%xmm3
- DB 15,89,136,210,102,0,0 ; mulps 0x66d2(%eax),%xmm1
- DB 15,40,176,226,102,0,0 ; movaps 0x66e2(%eax),%xmm6
- DB 15,92,241 ; subps %xmm1,%xmm6
- DB 15,89,244 ; mulps %xmm4,%xmm6
- DB 15,88,245 ; addps %xmm5,%xmm6
- DB 15,40,253 ; movaps %xmm5,%xmm7
+ DB 15,40,160,146,79,0,0 ; movaps 0x4f92(%eax),%xmm4
+ DB 15,194,225,2 ; cmpleps %xmm1,%xmm4
+ DB 15,89,206 ; mulps %xmm6,%xmm1
+ DB 15,40,168,130,79,0,0 ; movaps 0x4f82(%eax),%xmm5
+ DB 15,92,233 ; subps %xmm1,%xmm5
+ DB 15,89,239 ; mulps %xmm7,%xmm5
+ DB 15,88,234 ; addps %xmm2,%xmm5
+ DB 15,40,250 ; movaps %xmm2,%xmm7
DB 15,84,248 ; andps %xmm0,%xmm7
- DB 15,85,198 ; andnps %xmm6,%xmm0
+ DB 15,85,197 ; andnps %xmm5,%xmm0
DB 15,86,199 ; orps %xmm7,%xmm0
- DB 15,84,194 ; andps %xmm2,%xmm0
- DB 15,40,125,184 ; movaps -0x48(%ebp),%xmm7
- DB 15,85,215 ; andnps %xmm7,%xmm2
- DB 15,86,208 ; orps %xmm0,%xmm2
- DB 15,89,204 ; mulps %xmm4,%xmm1
- DB 15,88,205 ; addps %xmm5,%xmm1
- DB 15,84,211 ; andps %xmm3,%xmm2
- DB 15,85,217 ; andnps %xmm1,%xmm3
- DB 15,86,218 ; orps %xmm2,%xmm3
- DB 15,40,117,216 ; movaps -0x28(%ebp),%xmm6
- DB 15,85,243 ; andnps %xmm3,%xmm6
- DB 15,40,85,200 ; movaps -0x38(%ebp),%xmm2
- DB 15,88,144,2,103,0,0 ; addps 0x6702(%eax),%xmm2
- DB 243,15,91,194 ; cvttps2dq %xmm2,%xmm0
+ DB 15,84,195 ; andps %xmm3,%xmm0
+ DB 15,85,93,216 ; andnps -0x28(%ebp),%xmm3
+ DB 15,86,216 ; orps %xmm0,%xmm3
+ DB 15,40,109,200 ; movaps -0x38(%ebp),%xmm5
+ DB 15,89,205 ; mulps %xmm5,%xmm1
+ DB 15,88,202 ; addps %xmm2,%xmm1
+ DB 15,84,220 ; andps %xmm4,%xmm3
+ DB 15,85,225 ; andnps %xmm1,%xmm4
+ DB 15,86,227 ; orps %xmm3,%xmm4
+ DB 15,40,125,232 ; movaps -0x18(%ebp),%xmm7
+ DB 15,85,252 ; andnps %xmm4,%xmm7
+ DB 15,40,93,184 ; movaps -0x48(%ebp),%xmm3
+ DB 15,88,152,162,79,0,0 ; addps 0x4fa2(%eax),%xmm3
+ DB 243,15,91,195 ; cvttps2dq %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,40,202 ; movaps %xmm2,%xmm1
+ DB 15,40,203 ; movaps %xmm3,%xmm1
DB 15,194,200,1 ; cmpltps %xmm0,%xmm1
- DB 15,84,141,104,255,255,255 ; andps -0x98(%ebp),%xmm1
+ DB 15,84,77,136 ; andps -0x78(%ebp),%xmm1
DB 15,92,193 ; subps %xmm1,%xmm0
- DB 15,92,208 ; subps %xmm0,%xmm2
- DB 15,40,77,152 ; movaps -0x68(%ebp),%xmm1
- DB 15,89,202 ; mulps %xmm2,%xmm1
- DB 15,40,93,136 ; movaps -0x78(%ebp),%xmm3
- DB 15,92,217 ; subps %xmm1,%xmm3
- DB 15,89,220 ; mulps %xmm4,%xmm3
- DB 15,89,204 ; mulps %xmm4,%xmm1
- DB 15,88,221 ; addps %xmm5,%xmm3
- DB 15,88,205 ; addps %xmm5,%xmm1
- DB 15,40,229 ; movaps %xmm5,%xmm4
- DB 15,40,109,168 ; movaps -0x58(%ebp),%xmm5
- DB 15,194,234,2 ; cmpleps %xmm2,%xmm5
- DB 15,84,229 ; andps %xmm5,%xmm4
- DB 15,85,235 ; andnps %xmm3,%xmm5
- DB 15,86,236 ; orps %xmm4,%xmm5
- DB 15,40,133,72,255,255,255 ; movaps -0xb8(%ebp),%xmm0
- DB 15,194,194,2 ; cmpleps %xmm2,%xmm0
- DB 15,84,232 ; andps %xmm0,%xmm5
- DB 15,85,199 ; andnps %xmm7,%xmm0
- DB 15,86,197 ; orps %xmm5,%xmm0
- DB 15,40,157,88,255,255,255 ; movaps -0xa8(%ebp),%xmm3
- DB 15,194,218,2 ; cmpleps %xmm2,%xmm3
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
- DB 139,85,20 ; mov 0x14(%ebp),%edx
- DB 139,117,24 ; mov 0x18(%ebp),%esi
- DB 15,84,195 ; andps %xmm3,%xmm0
- DB 15,85,217 ; andnps %xmm1,%xmm3
- DB 15,40,109,40 ; movaps 0x28(%ebp),%xmm5
- DB 15,86,216 ; orps %xmm0,%xmm3
- DB 15,40,227 ; movaps %xmm3,%xmm4
- DB 15,40,77,56 ; movaps 0x38(%ebp),%xmm1
- DB 15,40,149,56,255,255,255 ; movaps -0xc8(%ebp),%xmm2
- DB 15,40,93,216 ; movaps -0x28(%ebp),%xmm3
- DB 15,84,211 ; andps %xmm3,%xmm2
- DB 15,85,220 ; andnps %xmm4,%xmm3
- DB 15,40,101,72 ; movaps 0x48(%ebp),%xmm4
- DB 15,40,133,120,255,255,255 ; movaps -0x88(%ebp),%xmm0
- DB 15,86,194 ; orps %xmm2,%xmm0
- DB 15,86,242 ; orps %xmm2,%xmm6
- DB 15,86,211 ; orps %xmm3,%xmm2
- DB 15,40,93,88 ; movaps 0x58(%ebp),%xmm3
- DB 139,125,12 ; mov 0xc(%ebp),%edi
- DB 141,95,4 ; lea 0x4(%edi),%ebx
- DB 15,41,92,36,80 ; movaps %xmm3,0x50(%esp)
- DB 15,41,100,36,64 ; movaps %xmm4,0x40(%esp)
- DB 15,41,76,36,48 ; movaps %xmm1,0x30(%esp)
- DB 15,41,108,36,32 ; movaps %xmm5,0x20(%esp)
- DB 137,116,36,16 ; mov %esi,0x10(%esp)
- DB 137,84,36,12 ; mov %edx,0xc(%esp)
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
- DB 15,40,206 ; movaps %xmm6,%xmm1
- DB 15,40,157,40,255,255,255 ; movaps -0xd8(%ebp),%xmm3
- DB 255,23 ; call *(%edi)
- DB 129,196,44,1,0,0 ; add $0x12c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 15,92,216 ; subps %xmm0,%xmm3
+ DB 15,89,243 ; mulps %xmm3,%xmm6
+ DB 15,40,77,168 ; movaps -0x58(%ebp),%xmm1
+ DB 15,92,206 ; subps %xmm6,%xmm1
+ DB 15,89,205 ; mulps %xmm5,%xmm1
+ DB 15,40,225 ; movaps %xmm1,%xmm4
+ DB 15,89,245 ; mulps %xmm5,%xmm6
+ DB 15,88,226 ; addps %xmm2,%xmm4
+ DB 15,88,242 ; addps %xmm2,%xmm6
+ DB 15,40,141,88,255,255,255 ; movaps -0xa8(%ebp),%xmm1
+ DB 15,194,203,2 ; cmpleps %xmm3,%xmm1
+ DB 15,84,209 ; andps %xmm1,%xmm2
+ DB 15,85,204 ; andnps %xmm4,%xmm1
+ DB 15,86,202 ; orps %xmm2,%xmm1
+ DB 15,40,133,104,255,255,255 ; movaps -0x98(%ebp),%xmm0
+ DB 15,194,195,2 ; cmpleps %xmm3,%xmm0
+ DB 15,84,200 ; andps %xmm0,%xmm1
+ DB 15,85,69,216 ; andnps -0x28(%ebp),%xmm0
+ DB 15,86,193 ; orps %xmm1,%xmm0
+ DB 15,40,141,120,255,255,255 ; movaps -0x88(%ebp),%xmm1
+ DB 15,194,203,2 ; cmpleps %xmm3,%xmm1
+ DB 15,84,193 ; andps %xmm1,%xmm0
+ DB 15,85,206 ; andnps %xmm6,%xmm1
+ DB 15,86,200 ; orps %xmm0,%xmm1
+ DB 15,40,209 ; movaps %xmm1,%xmm2
+ DB 15,40,157,72,255,255,255 ; movaps -0xb8(%ebp),%xmm3
+ DB 15,40,77,232 ; movaps -0x18(%ebp),%xmm1
+ DB 15,84,217 ; andps %xmm1,%xmm3
+ DB 15,85,202 ; andnps %xmm2,%xmm1
+ DB 15,40,69,152 ; movaps -0x68(%ebp),%xmm0
+ DB 15,86,195 ; orps %xmm3,%xmm0
+ DB 15,86,251 ; orps %xmm3,%xmm7
+ DB 15,86,217 ; orps %xmm1,%xmm3
+ DB 15,40,211 ; movaps %xmm3,%xmm2
+ DB 139,69,12 ; mov 0xc(%ebp),%eax
+ DB 141,72,4 ; lea 0x4(%eax),%ecx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 15,40,207 ; movaps %xmm7,%xmm1
+ DB 15,40,157,56,255,255,255 ; movaps -0xc8(%ebp),%xmm3
+ DB 81 ; push %ecx
+ DB 255,117,8 ; pushl 0x8(%ebp)
+ DB 255,16 ; call *(%eax)
+ DB 129,196,216,0,0,0 ; add $0xd8,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -40231,41 +39323,21 @@ PUBLIC _sk_scale_1_float_sse2
_sk_scale_1_float_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
- DB 139,85,20 ; mov 0x14(%ebp),%edx
- DB 139,117,12 ; mov 0xc(%ebp),%esi
- DB 139,62 ; mov (%esi),%edi
- DB 243,15,16,39 ; movss (%edi),%xmm4
- DB 139,125,24 ; mov 0x18(%ebp),%edi
- DB 15,40,109,40 ; movaps 0x28(%ebp),%xmm5
- DB 15,40,117,56 ; movaps 0x38(%ebp),%xmm6
- DB 15,40,125,72 ; movaps 0x48(%ebp),%xmm7
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 139,69,12 ; mov 0xc(%ebp),%eax
+ DB 139,8 ; mov (%eax),%ecx
+ DB 243,15,16,33 ; movss (%ecx),%xmm4
DB 15,198,228,0 ; shufps $0x0,%xmm4,%xmm4
DB 15,89,196 ; mulps %xmm4,%xmm0
DB 15,89,204 ; mulps %xmm4,%xmm1
DB 15,89,212 ; mulps %xmm4,%xmm2
DB 15,89,220 ; mulps %xmm4,%xmm3
- DB 15,40,101,88 ; movaps 0x58(%ebp),%xmm4
- DB 141,94,8 ; lea 0x8(%esi),%ebx
- DB 15,41,100,36,80 ; movaps %xmm4,0x50(%esp)
- DB 15,41,124,36,64 ; movaps %xmm7,0x40(%esp)
- DB 15,41,116,36,48 ; movaps %xmm6,0x30(%esp)
- DB 15,41,108,36,32 ; movaps %xmm5,0x20(%esp)
- DB 137,124,36,16 ; mov %edi,0x10(%esp)
- DB 137,84,36,12 ; mov %edx,0xc(%esp)
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
- DB 255,86,4 ; call *0x4(%esi)
- DB 131,196,108 ; add $0x6c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 141,72,8 ; lea 0x8(%eax),%ecx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 81 ; push %ecx
+ DB 255,117,8 ; pushl 0x8(%ebp)
+ DB 255,80,4 ; call *0x4(%eax)
+ DB 131,196,24 ; add $0x18,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -40276,122 +39348,94 @@ _sk_scale_u8_sse2 LABEL PROC
DB 83 ; push %ebx
DB 87 ; push %edi
DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 232,0,0,0,0 ; call 3274 <_sk_scale_u8_sse2+0xe>
- DB 95 ; pop %edi
- DB 15,40,125,72 ; movaps 0x48(%ebp),%xmm7
- DB 15,40,117,56 ; movaps 0x38(%ebp),%xmm6
- DB 15,40,109,40 ; movaps 0x28(%ebp),%xmm5
+ DB 131,236,12 ; sub $0xc,%esp
+ DB 232,0,0,0,0 ; call 2668 <_sk_scale_u8_sse2+0xe>
+ DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
- DB 139,48 ; mov (%eax),%esi
- DB 139,86,4 ; mov 0x4(%esi),%edx
- DB 15,175,85,20 ; imul 0x14(%ebp),%edx
- DB 3,22 ; add (%esi),%edx
- DB 139,93,24 ; mov 0x18(%ebp),%ebx
+ DB 139,77,8 ; mov 0x8(%ebp),%ecx
+ DB 139,56 ; mov (%eax),%edi
+ DB 139,119,4 ; mov 0x4(%edi),%esi
+ DB 15,175,113,4 ; imul 0x4(%ecx),%esi
+ DB 3,55 ; add (%edi),%esi
+ DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 133,219 ; test %ebx,%ebx
- DB 139,117,16 ; mov 0x10(%ebp),%esi
- DB 117,109 ; jne 3306 <_sk_scale_u8_sse2+0xa0>
- DB 102,15,110,36,50 ; movd (%edx,%esi,1),%xmm4
+ DB 139,57 ; mov (%ecx),%edi
+ DB 117,65 ; jne 26c4 <_sk_scale_u8_sse2+0x6a>
+ DB 102,15,110,36,62 ; movd (%esi,%edi,1),%xmm4
DB 102,15,96,224 ; punpcklbw %xmm0,%xmm4
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
- DB 102,15,219,167,12,100,0,0 ; pand 0x640c(%edi),%xmm4
+ DB 102,15,219,162,56,77,0,0 ; pand 0x4d38(%edx),%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,167,28,100,0,0 ; mulps 0x641c(%edi),%xmm4
+ DB 15,89,162,72,77,0,0 ; mulps 0x4d48(%edx),%xmm4
DB 15,89,196 ; mulps %xmm4,%xmm0
DB 15,89,204 ; mulps %xmm4,%xmm1
DB 15,89,212 ; mulps %xmm4,%xmm2
DB 15,89,227 ; mulps %xmm3,%xmm4
- DB 141,72,8 ; lea 0x8(%eax),%ecx
- DB 15,40,93,88 ; movaps 0x58(%ebp),%xmm3
- DB 15,41,92,36,80 ; movaps %xmm3,0x50(%esp)
- DB 15,41,124,36,64 ; movaps %xmm7,0x40(%esp)
- DB 15,41,116,36,48 ; movaps %xmm6,0x30(%esp)
- DB 15,41,108,36,32 ; movaps %xmm5,0x20(%esp)
- DB 137,92,36,16 ; mov %ebx,0x10(%esp)
- DB 139,85,20 ; mov 0x14(%ebp),%edx
- DB 137,84,36,12 ; mov %edx,0xc(%esp)
- DB 137,116,36,8 ; mov %esi,0x8(%esp)
- DB 137,76,36,4 ; mov %ecx,0x4(%esp)
- DB 139,77,8 ; mov 0x8(%ebp),%ecx
- DB 137,12,36 ; mov %ecx,(%esp)
+ DB 141,80,8 ; lea 0x8(%eax),%edx
+ DB 131,236,8 ; sub $0x8,%esp
DB 15,40,220 ; movaps %xmm4,%xmm3
+ DB 82 ; push %edx
+ DB 81 ; push %ecx
DB 255,80,4 ; call *0x4(%eax)
- DB 131,196,108 ; add $0x6c,%esp
+ DB 131,196,28 ; add $0x1c,%esp
DB 94 ; pop %esi
DB 95 ; pop %edi
DB 91 ; pop %ebx
DB 93 ; pop %ebp
DB 195 ; ret
- DB 137,217 ; mov %ebx,%ecx
- DB 128,225,3 ; and $0x3,%cl
- DB 128,249,1 ; cmp $0x1,%cl
- DB 116,57 ; je 3349 <_sk_scale_u8_sse2+0xe3>
+ DB 128,227,3 ; and $0x3,%bl
+ DB 128,251,1 ; cmp $0x1,%bl
+ DB 116,50 ; je 26fe <_sk_scale_u8_sse2+0xa4>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
- DB 128,249,2 ; cmp $0x2,%cl
- DB 116,19 ; je 332c <_sk_scale_u8_sse2+0xc6>
- DB 128,249,3 ; cmp $0x3,%cl
- DB 117,136 ; jne 32a6 <_sk_scale_u8_sse2+0x40>
- DB 15,182,76,50,2 ; movzbl 0x2(%edx,%esi,1),%ecx
- DB 102,15,110,225 ; movd %ecx,%xmm4
+ DB 128,251,2 ; cmp $0x2,%bl
+ DB 116,19 ; je 26e8 <_sk_scale_u8_sse2+0x8e>
+ DB 128,251,3 ; cmp $0x3,%bl
+ DB 117,182 ; jne 2690 <_sk_scale_u8_sse2+0x36>
+ DB 15,182,92,62,2 ; movzbl 0x2(%esi,%edi,1),%ebx
+ DB 102,15,110,227 ; movd %ebx,%xmm4
DB 102,15,112,228,69 ; pshufd $0x45,%xmm4,%xmm4
- DB 15,183,12,50 ; movzwl (%edx,%esi,1),%ecx
- DB 102,15,110,233 ; movd %ecx,%xmm5
+ DB 15,183,52,62 ; movzwl (%esi,%edi,1),%esi
+ DB 102,15,110,238 ; movd %esi,%xmm5
DB 102,15,96,232 ; punpcklbw %xmm0,%xmm5
DB 102,15,97,232 ; punpcklwd %xmm0,%xmm5
DB 242,15,16,229 ; movsd %xmm5,%xmm4
- DB 15,40,109,40 ; movaps 0x28(%ebp),%xmm5
- DB 233,93,255,255,255 ; jmp 32a6 <_sk_scale_u8_sse2+0x40>
- DB 15,182,12,50 ; movzbl (%edx,%esi,1),%ecx
- DB 102,15,110,225 ; movd %ecx,%xmm4
- DB 233,80,255,255,255 ; jmp 32a6 <_sk_scale_u8_sse2+0x40>
+ DB 235,146 ; jmp 2690 <_sk_scale_u8_sse2+0x36>
+ DB 15,182,52,62 ; movzbl (%esi,%edi,1),%esi
+ DB 102,15,110,230 ; movd %esi,%xmm4
+ DB 235,136 ; jmp 2690 <_sk_scale_u8_sse2+0x36>
PUBLIC _sk_lerp_1_float_sse2
_sk_lerp_1_float_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 15,40,109,56 ; movaps 0x38(%ebp),%xmm5
- DB 15,40,117,40 ; movaps 0x28(%ebp),%xmm6
- DB 139,69,12 ; mov 0xc(%ebp),%eax
- DB 139,8 ; mov (%eax),%ecx
- DB 243,15,16,57 ; movss (%ecx),%xmm7
- DB 15,198,255,0 ; shufps $0x0,%xmm7,%xmm7
- DB 15,92,198 ; subps %xmm6,%xmm0
- DB 15,89,199 ; mulps %xmm7,%xmm0
- DB 15,92,205 ; subps %xmm5,%xmm1
- DB 15,89,207 ; mulps %xmm7,%xmm1
- DB 15,92,85,72 ; subps 0x48(%ebp),%xmm2
- DB 15,89,215 ; mulps %xmm7,%xmm2
- DB 15,40,101,88 ; movaps 0x58(%ebp),%xmm4
- DB 15,92,220 ; subps %xmm4,%xmm3
- DB 15,89,223 ; mulps %xmm7,%xmm3
- DB 139,77,8 ; mov 0x8(%ebp),%ecx
- DB 139,85,16 ; mov 0x10(%ebp),%edx
- DB 139,117,20 ; mov 0x14(%ebp),%esi
- DB 139,125,24 ; mov 0x18(%ebp),%edi
- DB 15,88,198 ; addps %xmm6,%xmm0
- DB 15,88,205 ; addps %xmm5,%xmm1
- DB 15,40,125,72 ; movaps 0x48(%ebp),%xmm7
- DB 15,88,215 ; addps %xmm7,%xmm2
- DB 15,88,220 ; addps %xmm4,%xmm3
- DB 141,88,8 ; lea 0x8(%eax),%ebx
- DB 15,41,100,36,80 ; movaps %xmm4,0x50(%esp)
- DB 15,41,124,36,64 ; movaps %xmm7,0x40(%esp)
- DB 15,41,108,36,48 ; movaps %xmm5,0x30(%esp)
- DB 15,41,116,36,32 ; movaps %xmm6,0x20(%esp)
- DB 137,124,36,16 ; mov %edi,0x10(%esp)
- DB 137,116,36,12 ; mov %esi,0xc(%esp)
- DB 137,84,36,8 ; mov %edx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,12,36 ; mov %ecx,(%esp)
- DB 255,80,4 ; call *0x4(%eax)
- DB 131,196,108 ; add $0x6c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 139,69,8 ; mov 0x8(%ebp),%eax
+ DB 139,77,12 ; mov 0xc(%ebp),%ecx
+ DB 139,17 ; mov (%ecx),%edx
+ DB 243,15,16,34 ; movss (%edx),%xmm4
+ DB 15,198,228,0 ; shufps $0x0,%xmm4,%xmm4
+ DB 15,40,104,16 ; movaps 0x10(%eax),%xmm5
+ DB 15,40,112,32 ; movaps 0x20(%eax),%xmm6
+ DB 15,92,197 ; subps %xmm5,%xmm0
+ DB 15,89,196 ; mulps %xmm4,%xmm0
+ DB 15,88,197 ; addps %xmm5,%xmm0
+ DB 15,92,206 ; subps %xmm6,%xmm1
+ DB 15,89,204 ; mulps %xmm4,%xmm1
+ DB 15,88,206 ; addps %xmm6,%xmm1
+ DB 15,40,104,48 ; movaps 0x30(%eax),%xmm5
+ DB 15,92,213 ; subps %xmm5,%xmm2
+ DB 15,89,212 ; mulps %xmm4,%xmm2
+ DB 15,88,213 ; addps %xmm5,%xmm2
+ DB 15,40,104,64 ; movaps 0x40(%eax),%xmm5
+ DB 15,92,221 ; subps %xmm5,%xmm3
+ DB 15,89,220 ; mulps %xmm4,%xmm3
+ DB 15,88,221 ; addps %xmm5,%xmm3
+ DB 141,81,8 ; lea 0x8(%ecx),%edx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 82 ; push %edx
+ DB 80 ; push %eax
+ DB 255,81,4 ; call *0x4(%ecx)
+ DB 131,196,24 ; add $0x18,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -40402,84 +39446,72 @@ _sk_lerp_u8_sse2 LABEL PROC
DB 83 ; push %ebx
DB 87 ; push %edi
DB 86 ; push %esi
- DB 131,236,124 ; sub $0x7c,%esp
- DB 15,41,93,216 ; movaps %xmm3,-0x28(%ebp)
- DB 232,0,0,0,0 ; call 33f4 <_sk_lerp_u8_sse2+0x12>
- DB 95 ; pop %edi
- DB 15,40,109,40 ; movaps 0x28(%ebp),%xmm5
+ DB 131,236,12 ; sub $0xc,%esp
+ DB 232,0,0,0,0 ; call 2770 <_sk_lerp_u8_sse2+0xe>
+ DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
- DB 139,48 ; mov (%eax),%esi
- DB 139,86,4 ; mov 0x4(%esi),%edx
- DB 15,175,85,20 ; imul 0x14(%ebp),%edx
- DB 3,22 ; add (%esi),%edx
- DB 139,93,24 ; mov 0x18(%ebp),%ebx
+ DB 139,77,8 ; mov 0x8(%ebp),%ecx
+ DB 139,56 ; mov (%eax),%edi
+ DB 139,119,4 ; mov 0x4(%edi),%esi
+ DB 15,175,113,4 ; imul 0x4(%ecx),%esi
+ DB 3,55 ; add (%edi),%esi
+ DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 133,219 ; test %ebx,%ebx
- DB 139,117,16 ; mov 0x10(%ebp),%esi
- DB 15,133,146,0,0,0 ; jne 34a7 <_sk_lerp_u8_sse2+0xc5>
- DB 102,15,110,36,50 ; movd (%edx,%esi,1),%xmm4
+ DB 139,57 ; mov (%ecx),%edi
+ DB 117,102 ; jne 27f1 <_sk_lerp_u8_sse2+0x8f>
+ DB 102,15,110,36,62 ; movd (%esi,%edi,1),%xmm4
DB 102,15,96,224 ; punpcklbw %xmm0,%xmm4
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
- DB 102,15,219,167,172,98,0,0 ; pand 0x62ac(%edi),%xmm4
+ DB 102,15,219,162,80,76,0,0 ; pand 0x4c50(%edx),%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,167,188,98,0,0 ; mulps 0x62bc(%edi),%xmm4
+ DB 15,89,162,96,76,0,0 ; mulps 0x4c60(%edx),%xmm4
+ DB 15,40,105,16 ; movaps 0x10(%ecx),%xmm5
+ DB 15,40,113,32 ; movaps 0x20(%ecx),%xmm6
DB 15,92,197 ; subps %xmm5,%xmm0
DB 15,89,196 ; mulps %xmm4,%xmm0
- DB 15,40,117,56 ; movaps 0x38(%ebp),%xmm6
+ DB 15,88,197 ; addps %xmm5,%xmm0
DB 15,92,206 ; subps %xmm6,%xmm1
DB 15,89,204 ; mulps %xmm4,%xmm1
- DB 15,40,125,72 ; movaps 0x48(%ebp),%xmm7
- DB 15,92,215 ; subps %xmm7,%xmm2
+ DB 15,88,206 ; addps %xmm6,%xmm1
+ DB 15,40,105,48 ; movaps 0x30(%ecx),%xmm5
+ DB 15,92,213 ; subps %xmm5,%xmm2
DB 15,89,212 ; mulps %xmm4,%xmm2
- DB 15,40,109,88 ; movaps 0x58(%ebp),%xmm5
- DB 15,40,93,216 ; movaps -0x28(%ebp),%xmm3
+ DB 15,88,213 ; addps %xmm5,%xmm2
+ DB 15,40,105,64 ; movaps 0x40(%ecx),%xmm5
DB 15,92,221 ; subps %xmm5,%xmm3
DB 15,89,220 ; mulps %xmm4,%xmm3
- DB 15,40,101,40 ; movaps 0x28(%ebp),%xmm4
- DB 15,88,196 ; addps %xmm4,%xmm0
- DB 15,88,206 ; addps %xmm6,%xmm1
- DB 15,88,215 ; addps %xmm7,%xmm2
DB 15,88,221 ; addps %xmm5,%xmm3
- DB 141,72,8 ; lea 0x8(%eax),%ecx
- DB 15,41,108,36,80 ; movaps %xmm5,0x50(%esp)
- DB 15,41,124,36,64 ; movaps %xmm7,0x40(%esp)
- DB 15,41,116,36,48 ; movaps %xmm6,0x30(%esp)
- DB 15,41,100,36,32 ; movaps %xmm4,0x20(%esp)
- DB 137,92,36,16 ; mov %ebx,0x10(%esp)
- DB 139,85,20 ; mov 0x14(%ebp),%edx
- DB 137,84,36,12 ; mov %edx,0xc(%esp)
- DB 137,116,36,8 ; mov %esi,0x8(%esp)
- DB 137,76,36,4 ; mov %ecx,0x4(%esp)
- DB 139,77,8 ; mov 0x8(%ebp),%ecx
- DB 137,12,36 ; mov %ecx,(%esp)
+ DB 141,80,8 ; lea 0x8(%eax),%edx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 82 ; push %edx
+ DB 81 ; push %ecx
DB 255,80,4 ; call *0x4(%eax)
- DB 131,196,124 ; add $0x7c,%esp
+ DB 131,196,28 ; add $0x1c,%esp
DB 94 ; pop %esi
DB 95 ; pop %edi
DB 91 ; pop %ebx
DB 93 ; pop %ebp
DB 195 ; ret
- DB 137,217 ; mov %ebx,%ecx
- DB 128,225,3 ; and $0x3,%cl
- DB 128,249,1 ; cmp $0x1,%cl
- DB 116,61 ; je 34ee <_sk_lerp_u8_sse2+0x10c>
+ DB 128,227,3 ; and $0x3,%bl
+ DB 128,251,1 ; cmp $0x1,%bl
+ DB 116,53 ; je 282e <_sk_lerp_u8_sse2+0xcc>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
- DB 128,249,2 ; cmp $0x2,%cl
- DB 116,23 ; je 34d1 <_sk_lerp_u8_sse2+0xef>
- DB 128,249,3 ; cmp $0x3,%cl
- DB 15,133,95,255,255,255 ; jne 3422 <_sk_lerp_u8_sse2+0x40>
- DB 15,182,76,50,2 ; movzbl 0x2(%edx,%esi,1),%ecx
- DB 102,15,110,225 ; movd %ecx,%xmm4
+ DB 128,251,2 ; cmp $0x2,%bl
+ DB 116,19 ; je 2815 <_sk_lerp_u8_sse2+0xb3>
+ DB 128,251,3 ; cmp $0x3,%bl
+ DB 117,145 ; jne 2798 <_sk_lerp_u8_sse2+0x36>
+ DB 15,182,92,62,2 ; movzbl 0x2(%esi,%edi,1),%ebx
+ DB 102,15,110,227 ; movd %ebx,%xmm4
DB 102,15,112,228,69 ; pshufd $0x45,%xmm4,%xmm4
- DB 15,183,12,50 ; movzwl (%edx,%esi,1),%ecx
- DB 102,15,110,233 ; movd %ecx,%xmm5
+ DB 15,183,52,62 ; movzwl (%esi,%edi,1),%esi
+ DB 102,15,110,238 ; movd %esi,%xmm5
DB 102,15,96,232 ; punpcklbw %xmm0,%xmm5
DB 102,15,97,232 ; punpcklwd %xmm0,%xmm5
DB 242,15,16,229 ; movsd %xmm5,%xmm4
- DB 15,40,109,40 ; movaps 0x28(%ebp),%xmm5
- DB 233,52,255,255,255 ; jmp 3422 <_sk_lerp_u8_sse2+0x40>
- DB 15,182,12,50 ; movzbl (%edx,%esi,1),%ecx
- DB 102,15,110,225 ; movd %ecx,%xmm4
- DB 233,39,255,255,255 ; jmp 3422 <_sk_lerp_u8_sse2+0x40>
+ DB 233,106,255,255,255 ; jmp 2798 <_sk_lerp_u8_sse2+0x36>
+ DB 15,182,52,62 ; movzbl (%esi,%edi,1),%esi
+ DB 102,15,110,230 ; movd %esi,%xmm4
+ DB 233,93,255,255,255 ; jmp 2798 <_sk_lerp_u8_sse2+0x36>
PUBLIC _sk_lerp_565_sse2
_sk_lerp_565_sse2 LABEL PROC
@@ -40488,96 +39520,85 @@ _sk_lerp_565_sse2 LABEL PROC
DB 83 ; push %ebx
DB 87 ; push %edi
DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 232,0,0,0,0 ; call 3509 <_sk_lerp_565_sse2+0xe>
- DB 95 ; pop %edi
+ DB 131,236,12 ; sub $0xc,%esp
+ DB 232,0,0,0,0 ; call 2849 <_sk_lerp_565_sse2+0xe>
+ DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
- DB 139,48 ; mov (%eax),%esi
- DB 139,86,4 ; mov 0x4(%esi),%edx
- DB 15,175,85,20 ; imul 0x14(%ebp),%edx
- DB 1,210 ; add %edx,%edx
- DB 3,22 ; add (%esi),%edx
- DB 139,93,24 ; mov 0x18(%ebp),%ebx
+ DB 139,77,8 ; mov 0x8(%ebp),%ecx
+ DB 139,56 ; mov (%eax),%edi
+ DB 139,119,4 ; mov 0x4(%edi),%esi
+ DB 15,175,113,4 ; imul 0x4(%ecx),%esi
+ DB 1,246 ; add %esi,%esi
+ DB 3,55 ; add (%edi),%esi
+ DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 133,219 ; test %ebx,%ebx
- DB 139,117,16 ; mov 0x10(%ebp),%esi
- DB 15,133,215,0,0,0 ; jne 35ff <_sk_lerp_565_sse2+0x104>
- DB 243,15,126,52,114 ; movq (%edx,%esi,2),%xmm6
+ DB 139,57 ; mov (%ecx),%edi
+ DB 15,133,163,0,0,0 ; jne 290d <_sk_lerp_565_sse2+0xd2>
+ DB 243,15,126,52,126 ; movq (%esi,%edi,2),%xmm6
DB 102,15,97,240 ; punpcklwd %xmm0,%xmm6
- DB 102,15,111,167,183,97,0,0 ; movdqa 0x61b7(%edi),%xmm4
+ DB 102,15,111,162,151,75,0,0 ; movdqa 0x4b97(%edx),%xmm4
DB 102,15,219,230 ; pand %xmm6,%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,167,199,97,0,0 ; mulps 0x61c7(%edi),%xmm4
- DB 102,15,111,191,215,97,0,0 ; movdqa 0x61d7(%edi),%xmm7
- DB 102,15,219,254 ; pand %xmm6,%xmm7
- DB 15,91,255 ; cvtdq2ps %xmm7,%xmm7
- DB 15,89,191,231,97,0,0 ; mulps 0x61e7(%edi),%xmm7
- DB 102,15,219,183,247,97,0,0 ; pand 0x61f7(%edi),%xmm6
+ DB 15,89,162,167,75,0,0 ; mulps 0x4ba7(%edx),%xmm4
+ DB 102,15,111,170,183,75,0,0 ; movdqa 0x4bb7(%edx),%xmm5
+ DB 102,15,219,238 ; pand %xmm6,%xmm5
+ DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
+ DB 15,89,170,199,75,0,0 ; mulps 0x4bc7(%edx),%xmm5
+ DB 102,15,219,178,215,75,0,0 ; pand 0x4bd7(%edx),%xmm6
DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
- DB 15,89,183,7,98,0,0 ; mulps 0x6207(%edi),%xmm6
- DB 15,40,109,40 ; movaps 0x28(%ebp),%xmm5
- DB 15,92,197 ; subps %xmm5,%xmm0
+ DB 15,89,178,231,75,0,0 ; mulps 0x4be7(%edx),%xmm6
+ DB 15,40,121,16 ; movaps 0x10(%ecx),%xmm7
+ DB 15,92,199 ; subps %xmm7,%xmm0
DB 15,89,196 ; mulps %xmm4,%xmm0
- DB 15,40,109,56 ; movaps 0x38(%ebp),%xmm5
- DB 15,92,205 ; subps %xmm5,%xmm1
- DB 15,89,207 ; mulps %xmm7,%xmm1
- DB 15,40,109,72 ; movaps 0x48(%ebp),%xmm5
- DB 15,92,213 ; subps %xmm5,%xmm2
+ DB 15,88,199 ; addps %xmm7,%xmm0
+ DB 15,40,121,32 ; movaps 0x20(%ecx),%xmm7
+ DB 15,92,207 ; subps %xmm7,%xmm1
+ DB 15,89,205 ; mulps %xmm5,%xmm1
+ DB 15,88,207 ; addps %xmm7,%xmm1
+ DB 15,40,121,48 ; movaps 0x30(%ecx),%xmm7
+ DB 15,92,215 ; subps %xmm7,%xmm2
DB 15,89,214 ; mulps %xmm6,%xmm2
- DB 15,40,109,88 ; movaps 0x58(%ebp),%xmm5
- DB 15,92,221 ; subps %xmm5,%xmm3
+ DB 15,88,215 ; addps %xmm7,%xmm2
+ DB 15,40,121,64 ; movaps 0x40(%ecx),%xmm7
+ DB 15,92,223 ; subps %xmm7,%xmm3
DB 15,89,227 ; mulps %xmm3,%xmm4
- DB 15,89,251 ; mulps %xmm3,%xmm7
+ DB 15,89,235 ; mulps %xmm3,%xmm5
DB 15,89,222 ; mulps %xmm6,%xmm3
- DB 15,88,253 ; addps %xmm5,%xmm7
- DB 15,88,221 ; addps %xmm5,%xmm3
- DB 15,95,251 ; maxps %xmm3,%xmm7
- DB 15,88,229 ; addps %xmm5,%xmm4
- DB 15,95,231 ; maxps %xmm7,%xmm4
- DB 15,40,93,40 ; movaps 0x28(%ebp),%xmm3
- DB 15,88,195 ; addps %xmm3,%xmm0
- DB 15,40,117,56 ; movaps 0x38(%ebp),%xmm6
- DB 15,88,206 ; addps %xmm6,%xmm1
- DB 15,40,125,72 ; movaps 0x48(%ebp),%xmm7
- DB 15,88,215 ; addps %xmm7,%xmm2
- DB 141,72,8 ; lea 0x8(%eax),%ecx
- DB 15,41,108,36,80 ; movaps %xmm5,0x50(%esp)
- DB 15,41,124,36,64 ; movaps %xmm7,0x40(%esp)
- DB 15,41,116,36,48 ; movaps %xmm6,0x30(%esp)
- DB 15,41,92,36,32 ; movaps %xmm3,0x20(%esp)
- DB 137,92,36,16 ; mov %ebx,0x10(%esp)
- DB 139,85,20 ; mov 0x14(%ebp),%edx
- DB 137,84,36,12 ; mov %edx,0xc(%esp)
- DB 137,116,36,8 ; mov %esi,0x8(%esp)
- DB 137,76,36,4 ; mov %ecx,0x4(%esp)
- DB 139,77,8 ; mov 0x8(%ebp),%ecx
- DB 137,12,36 ; mov %ecx,(%esp)
+ DB 15,88,231 ; addps %xmm7,%xmm4
+ DB 15,88,239 ; addps %xmm7,%xmm5
+ DB 15,88,223 ; addps %xmm7,%xmm3
+ DB 15,95,235 ; maxps %xmm3,%xmm5
+ DB 15,95,229 ; maxps %xmm5,%xmm4
+ DB 141,80,8 ; lea 0x8(%eax),%edx
+ DB 131,236,8 ; sub $0x8,%esp
DB 15,40,220 ; movaps %xmm4,%xmm3
+ DB 82 ; push %edx
+ DB 81 ; push %ecx
DB 255,80,4 ; call *0x4(%eax)
- DB 131,196,108 ; add $0x6c,%esp
+ DB 131,196,28 ; add $0x1c,%esp
DB 94 ; pop %esi
DB 95 ; pop %edi
DB 91 ; pop %ebx
DB 93 ; pop %ebp
DB 195 ; ret
- DB 137,217 ; mov %ebx,%ecx
- DB 128,225,3 ; and $0x3,%cl
- DB 128,249,1 ; cmp $0x1,%cl
- DB 116,50 ; je 363b <_sk_lerp_565_sse2+0x140>
+ DB 128,227,3 ; and $0x3,%bl
+ DB 128,251,1 ; cmp $0x1,%bl
+ DB 116,50 ; je 2947 <_sk_lerp_565_sse2+0x10c>
DB 102,15,239,246 ; pxor %xmm6,%xmm6
- DB 128,249,2 ; cmp $0x2,%cl
- DB 116,23 ; je 3629 <_sk_lerp_565_sse2+0x12e>
- DB 128,249,3 ; cmp $0x3,%cl
- DB 15,133,22,255,255,255 ; jne 3531 <_sk_lerp_565_sse2+0x36>
- DB 15,183,76,114,4 ; movzwl 0x4(%edx,%esi,2),%ecx
- DB 102,15,110,225 ; movd %ecx,%xmm4
+ DB 128,251,2 ; cmp $0x2,%bl
+ DB 116,23 ; je 2935 <_sk_lerp_565_sse2+0xfa>
+ DB 128,251,3 ; cmp $0x3,%bl
+ DB 15,133,76,255,255,255 ; jne 2873 <_sk_lerp_565_sse2+0x38>
+ DB 15,183,92,126,4 ; movzwl 0x4(%esi,%edi,2),%ebx
+ DB 102,15,110,227 ; movd %ebx,%xmm4
DB 102,15,112,244,69 ; pshufd $0x45,%xmm4,%xmm6
- DB 102,15,110,36,114 ; movd (%edx,%esi,2),%xmm4
+ DB 102,15,110,36,126 ; movd (%esi,%edi,2),%xmm4
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
DB 242,15,16,244 ; movsd %xmm4,%xmm6
- DB 233,246,254,255,255 ; jmp 3531 <_sk_lerp_565_sse2+0x36>
- DB 15,183,12,114 ; movzwl (%edx,%esi,2),%ecx
- DB 102,15,110,241 ; movd %ecx,%xmm6
- DB 233,233,254,255,255 ; jmp 3531 <_sk_lerp_565_sse2+0x36>
+ DB 233,44,255,255,255 ; jmp 2873 <_sk_lerp_565_sse2+0x38>
+ DB 15,183,52,126 ; movzwl (%esi,%edi,2),%esi
+ DB 102,15,110,246 ; movd %esi,%xmm6
+ DB 233,31,255,255,255 ; jmp 2873 <_sk_lerp_565_sse2+0x38>
PUBLIC _sk_load_tables_sse2
_sk_load_tables_sse2 LABEL PROC
@@ -40586,33 +39607,34 @@ _sk_load_tables_sse2 LABEL PROC
DB 83 ; push %ebx
DB 87 ; push %edi
DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 232,0,0,0,0 ; call 3656 <_sk_load_tables_sse2+0xe>
- DB 94 ; pop %esi
- DB 139,69,24 ; mov 0x18(%ebp),%eax
- DB 139,93,16 ; mov 0x10(%ebp),%ebx
- DB 139,77,12 ; mov 0xc(%ebp),%ecx
+ DB 131,236,12 ; sub $0xc,%esp
+ DB 232,0,0,0,0 ; call 2962 <_sk_load_tables_sse2+0xe>
+ DB 90 ; pop %edx
+ DB 139,117,12 ; mov 0xc(%ebp),%esi
+ DB 139,77,8 ; mov 0x8(%ebp),%ecx
+ DB 139,57 ; mov (%ecx),%edi
+ DB 139,65,8 ; mov 0x8(%ecx),%eax
DB 133,192 ; test %eax,%eax
- DB 139,17 ; mov (%ecx),%edx
- DB 139,58 ; mov (%edx),%edi
- DB 15,133,75,1,0,0 ; jne 37b7 <_sk_load_tables_sse2+0x16f>
- DB 243,15,111,28,159 ; movdqu (%edi,%ebx,4),%xmm3
- DB 102,15,111,150,202,96,0,0 ; movdqa 0x60ca(%esi),%xmm2
+ DB 139,54 ; mov (%esi),%esi
+ DB 139,30 ; mov (%esi),%ebx
+ DB 15,133,19,1,0,0 ; jne 2a8d <_sk_load_tables_sse2+0x139>
+ DB 243,15,111,28,187 ; movdqu (%ebx,%edi,4),%xmm3
+ DB 102,15,111,146,222,74,0,0 ; movdqa 0x4ade(%edx),%xmm2
DB 102,15,111,195 ; movdqa %xmm3,%xmm0
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 102,15,112,200,229 ; pshufd $0xe5,%xmm0,%xmm1
DB 102,15,112,224,231 ; pshufd $0xe7,%xmm0,%xmm4
- DB 102,15,126,231 ; movd %xmm4,%edi
- DB 139,74,4 ; mov 0x4(%edx),%ecx
- DB 243,15,16,36,185 ; movss (%ecx,%edi,4),%xmm4
- DB 102,15,126,207 ; movd %xmm1,%edi
- DB 243,15,16,44,185 ; movss (%ecx,%edi,4),%xmm5
- DB 102,15,126,199 ; movd %xmm0,%edi
+ DB 102,15,126,224 ; movd %xmm4,%eax
+ DB 139,126,4 ; mov 0x4(%esi),%edi
+ DB 243,15,16,36,135 ; movss (%edi,%eax,4),%xmm4
+ DB 102,15,126,200 ; movd %xmm1,%eax
+ DB 243,15,16,44,135 ; movss (%edi,%eax,4),%xmm5
+ DB 102,15,126,192 ; movd %xmm0,%eax
DB 102,15,112,200,78 ; pshufd $0x4e,%xmm0,%xmm1
- DB 243,15,16,4,185 ; movss (%ecx,%edi,4),%xmm0
- DB 102,15,126,207 ; movd %xmm1,%edi
- DB 243,15,16,12,185 ; movss (%ecx,%edi,4),%xmm1
- DB 139,74,8 ; mov 0x8(%edx),%ecx
+ DB 243,15,16,4,135 ; movss (%edi,%eax,4),%xmm0
+ DB 102,15,126,200 ; movd %xmm1,%eax
+ DB 243,15,16,12,135 ; movss (%edi,%eax,4),%xmm1
+ DB 139,70,8 ; mov 0x8(%esi),%eax
DB 15,20,236 ; unpcklps %xmm4,%xmm5
DB 15,20,193 ; unpcklps %xmm1,%xmm0
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
@@ -40621,79 +39643,66 @@ _sk_load_tables_sse2 LABEL PROC
DB 102,15,112,225,229 ; pshufd $0xe5,%xmm1,%xmm4
DB 102,15,112,241,231 ; pshufd $0xe7,%xmm1,%xmm6
DB 102,15,126,247 ; movd %xmm6,%edi
- DB 243,15,16,52,185 ; movss (%ecx,%edi,4),%xmm6
+ DB 243,15,16,52,184 ; movss (%eax,%edi,4),%xmm6
DB 102,15,126,231 ; movd %xmm4,%edi
- DB 243,15,16,36,185 ; movss (%ecx,%edi,4),%xmm4
+ DB 243,15,16,36,184 ; movss (%eax,%edi,4),%xmm4
DB 102,15,126,207 ; movd %xmm1,%edi
DB 102,15,112,249,78 ; pshufd $0x4e,%xmm1,%xmm7
- DB 243,15,16,12,185 ; movss (%ecx,%edi,4),%xmm1
+ DB 243,15,16,12,184 ; movss (%eax,%edi,4),%xmm1
DB 102,15,126,255 ; movd %xmm7,%edi
- DB 243,15,16,60,185 ; movss (%ecx,%edi,4),%xmm7
+ DB 243,15,16,60,184 ; movss (%eax,%edi,4),%xmm7
DB 15,20,197 ; unpcklps %xmm5,%xmm0
DB 15,20,230 ; unpcklps %xmm6,%xmm4
DB 15,20,207 ; unpcklps %xmm7,%xmm1
- DB 139,74,12 ; mov 0xc(%edx),%ecx
+ DB 139,70,12 ; mov 0xc(%esi),%eax
DB 102,15,111,235 ; movdqa %xmm3,%xmm5
DB 102,15,114,213,16 ; psrld $0x10,%xmm5
DB 102,15,219,234 ; pand %xmm2,%xmm5
DB 102,15,112,213,229 ; pshufd $0xe5,%xmm5,%xmm2
DB 102,15,112,245,231 ; pshufd $0xe7,%xmm5,%xmm6
- DB 102,15,126,242 ; movd %xmm6,%edx
- DB 243,15,16,52,145 ; movss (%ecx,%edx,4),%xmm6
- DB 102,15,126,210 ; movd %xmm2,%edx
- DB 243,15,16,60,145 ; movss (%ecx,%edx,4),%xmm7
- DB 102,15,126,234 ; movd %xmm5,%edx
+ DB 102,15,126,246 ; movd %xmm6,%esi
+ DB 243,15,16,52,176 ; movss (%eax,%esi,4),%xmm6
+ DB 102,15,126,214 ; movd %xmm2,%esi
+ DB 243,15,16,60,176 ; movss (%eax,%esi,4),%xmm7
+ DB 102,15,126,238 ; movd %xmm5,%esi
DB 102,15,112,237,78 ; pshufd $0x4e,%xmm5,%xmm5
- DB 243,15,16,20,145 ; movss (%ecx,%edx,4),%xmm2
- DB 102,15,126,234 ; movd %xmm5,%edx
- DB 243,15,16,44,145 ; movss (%ecx,%edx,4),%xmm5
+ DB 243,15,16,20,176 ; movss (%eax,%esi,4),%xmm2
+ DB 102,15,126,238 ; movd %xmm5,%esi
+ DB 243,15,16,44,176 ; movss (%eax,%esi,4),%xmm5
DB 15,20,204 ; unpcklps %xmm4,%xmm1
DB 15,20,254 ; unpcklps %xmm6,%xmm7
DB 15,20,213 ; unpcklps %xmm5,%xmm2
DB 15,20,215 ; unpcklps %xmm7,%xmm2
DB 102,15,114,211,24 ; psrld $0x18,%xmm3
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,158,218,96,0,0 ; mulps 0x60da(%esi),%xmm3
- DB 139,77,12 ; mov 0xc(%ebp),%ecx
- DB 137,206 ; mov %ecx,%esi
- DB 141,78,8 ; lea 0x8(%esi),%ecx
- DB 15,40,101,88 ; movaps 0x58(%ebp),%xmm4
- DB 15,41,100,36,80 ; movaps %xmm4,0x50(%esp)
- DB 15,40,101,72 ; movaps 0x48(%ebp),%xmm4
- DB 15,41,100,36,64 ; movaps %xmm4,0x40(%esp)
- DB 15,40,101,56 ; movaps 0x38(%ebp),%xmm4
- DB 15,41,100,36,48 ; movaps %xmm4,0x30(%esp)
- DB 15,40,101,40 ; movaps 0x28(%ebp),%xmm4
- DB 15,41,100,36,32 ; movaps %xmm4,0x20(%esp)
- DB 137,68,36,16 ; mov %eax,0x10(%esp)
- DB 139,85,20 ; mov 0x14(%ebp),%edx
- DB 137,84,36,12 ; mov %edx,0xc(%esp)
- DB 137,92,36,8 ; mov %ebx,0x8(%esp)
- DB 137,76,36,4 ; mov %ecx,0x4(%esp)
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 137,4,36 ; mov %eax,(%esp)
- DB 255,86,4 ; call *0x4(%esi)
- DB 131,196,108 ; add $0x6c,%esp
+ DB 15,89,154,238,74,0,0 ; mulps 0x4aee(%edx),%xmm3
+ DB 139,69,12 ; mov 0xc(%ebp),%eax
+ DB 137,194 ; mov %eax,%edx
+ DB 141,66,8 ; lea 0x8(%edx),%eax
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 80 ; push %eax
+ DB 81 ; push %ecx
+ DB 255,82,4 ; call *0x4(%edx)
+ DB 131,196,28 ; add $0x1c,%esp
DB 94 ; pop %esi
DB 95 ; pop %edi
DB 91 ; pop %ebx
DB 93 ; pop %ebp
DB 195 ; ret
- DB 137,193 ; mov %eax,%ecx
- DB 128,225,3 ; and $0x3,%cl
- DB 128,249,1 ; cmp $0x1,%cl
- DB 116,39 ; je 37e8 <_sk_load_tables_sse2+0x1a0>
+ DB 36,3 ; and $0x3,%al
+ DB 60,1 ; cmp $0x1,%al
+ DB 116,37 ; je 2ab8 <_sk_load_tables_sse2+0x164>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
- DB 128,249,2 ; cmp $0x2,%cl
- DB 116,20 ; je 37de <_sk_load_tables_sse2+0x196>
- DB 128,249,3 ; cmp $0x3,%cl
- DB 15,133,158,254,255,255 ; jne 3671 <_sk_load_tables_sse2+0x29>
- DB 102,15,110,68,159,8 ; movd 0x8(%edi,%ebx,4),%xmm0
+ DB 60,2 ; cmp $0x2,%al
+ DB 116,19 ; je 2aae <_sk_load_tables_sse2+0x15a>
+ DB 60,3 ; cmp $0x3,%al
+ DB 15,133,220,254,255,255 ; jne 297f <_sk_load_tables_sse2+0x2b>
+ DB 102,15,110,68,187,8 ; movd 0x8(%ebx,%edi,4),%xmm0
DB 102,15,112,216,69 ; pshufd $0x45,%xmm0,%xmm3
- DB 102,15,18,28,159 ; movlpd (%edi,%ebx,4),%xmm3
- DB 233,137,254,255,255 ; jmp 3671 <_sk_load_tables_sse2+0x29>
- DB 102,15,110,28,159 ; movd (%edi,%ebx,4),%xmm3
- DB 233,127,254,255,255 ; jmp 3671 <_sk_load_tables_sse2+0x29>
+ DB 102,15,18,28,187 ; movlpd (%ebx,%edi,4),%xmm3
+ DB 233,199,254,255,255 ; jmp 297f <_sk_load_tables_sse2+0x2b>
+ DB 102,15,110,28,187 ; movd (%ebx,%edi,4),%xmm3
+ DB 233,189,254,255,255 ; jmp 297f <_sk_load_tables_sse2+0x2b>
PUBLIC _sk_load_tables_u16_be_sse2
_sk_load_tables_u16_be_sse2 LABEL PROC
@@ -40702,19 +39711,21 @@ _sk_load_tables_u16_be_sse2 LABEL PROC
DB 83 ; push %ebx
DB 87 ; push %edi
DB 86 ; push %esi
- DB 129,236,140,0,0,0 ; sub $0x8c,%esp
- DB 232,0,0,0,0 ; call 3803 <_sk_load_tables_u16_be_sse2+0x11>
- DB 95 ; pop %edi
- DB 139,85,16 ; mov 0x10(%ebp),%edx
- DB 139,69,12 ; mov 0xc(%ebp),%eax
- DB 131,125,24,0 ; cmpl $0x0,0x18(%ebp)
+ DB 131,236,44 ; sub $0x2c,%esp
+ DB 232,0,0,0,0 ; call 2ad0 <_sk_load_tables_u16_be_sse2+0xe>
+ DB 90 ; pop %edx
+ DB 139,77,12 ; mov 0xc(%ebp),%ecx
+ DB 139,69,8 ; mov 0x8(%ebp),%eax
DB 139,24 ; mov (%eax),%ebx
- DB 139,11 ; mov (%ebx),%ecx
- DB 141,52,149,0,0,0,0 ; lea 0x0(,%edx,4),%esi
- DB 186,255,0,255,0 ; mov $0xff00ff,%edx
- DB 15,133,229,1,0,0 ; jne 3a09 <_sk_load_tables_u16_be_sse2+0x217>
- DB 102,15,16,4,113 ; movupd (%ecx,%esi,2),%xmm0
- DB 243,15,111,76,113,16 ; movdqu 0x10(%ecx,%esi,2),%xmm1
+ DB 139,64,8 ; mov 0x8(%eax),%eax
+ DB 193,227,2 ; shl $0x2,%ebx
+ DB 133,192 ; test %eax,%eax
+ DB 139,57 ; mov (%ecx),%edi
+ DB 139,15 ; mov (%edi),%ecx
+ DB 190,255,0,255,0 ; mov $0xff00ff,%esi
+ DB 15,133,166,1,0,0 ; jne 2c96 <_sk_load_tables_u16_be_sse2+0x1d4>
+ DB 102,15,16,4,89 ; movupd (%ecx,%ebx,2),%xmm0
+ DB 243,15,111,76,89,16 ; movdqu 0x10(%ecx,%ebx,2),%xmm1
DB 102,15,40,216 ; movapd %xmm0,%xmm3
DB 102,15,97,217 ; punpcklwd %xmm1,%xmm3
DB 102,15,105,193 ; punpckhwd %xmm1,%xmm0
@@ -40722,64 +39733,64 @@ _sk_load_tables_u16_be_sse2 LABEL PROC
DB 102,15,97,208 ; punpcklwd %xmm0,%xmm2
DB 102,15,105,216 ; punpckhwd %xmm0,%xmm3
DB 102,15,112,194,229 ; pshufd $0xe5,%xmm2,%xmm0
- DB 102,15,126,193 ; movd %xmm0,%ecx
- DB 102,15,126,214 ; movd %xmm2,%esi
+ DB 102,15,126,192 ; movd %xmm0,%eax
+ DB 102,15,126,209 ; movd %xmm2,%ecx
DB 102,15,112,202,78 ; pshufd $0x4e,%xmm2,%xmm1
DB 102,15,112,234,231 ; pshufd $0xe7,%xmm2,%xmm5
- DB 33,214 ; and %edx,%esi
- DB 137,117,216 ; mov %esi,-0x28(%ebp)
- DB 33,209 ; and %edx,%ecx
- DB 137,77,220 ; mov %ecx,-0x24(%ebp)
+ DB 33,241 ; and %esi,%ecx
+ DB 137,77,216 ; mov %ecx,-0x28(%ebp)
+ DB 33,240 ; and %esi,%eax
+ DB 137,69,220 ; mov %eax,-0x24(%ebp)
DB 243,15,126,69,216 ; movq -0x28(%ebp),%xmm0
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 102,15,97,194 ; punpcklwd %xmm2,%xmm0
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 102,15,112,208,229 ; pshufd $0xe5,%xmm0,%xmm2
DB 102,15,112,240,231 ; pshufd $0xe7,%xmm0,%xmm6
- DB 102,15,126,241 ; movd %xmm6,%ecx
- DB 139,115,4 ; mov 0x4(%ebx),%esi
- DB 243,15,16,52,142 ; movss (%esi,%ecx,4),%xmm6
- DB 102,15,126,209 ; movd %xmm2,%ecx
- DB 243,15,16,20,142 ; movss (%esi,%ecx,4),%xmm2
- DB 102,15,126,193 ; movd %xmm0,%ecx
+ DB 102,15,126,240 ; movd %xmm6,%eax
+ DB 139,79,4 ; mov 0x4(%edi),%ecx
+ DB 243,15,16,52,129 ; movss (%ecx,%eax,4),%xmm6
+ DB 102,15,126,208 ; movd %xmm2,%eax
+ DB 243,15,16,20,129 ; movss (%ecx,%eax,4),%xmm2
+ DB 102,15,126,192 ; movd %xmm0,%eax
DB 102,15,112,248,78 ; pshufd $0x4e,%xmm0,%xmm7
- DB 243,15,16,4,142 ; movss (%esi,%ecx,4),%xmm0
- DB 102,15,126,249 ; movd %xmm7,%ecx
- DB 243,15,16,60,142 ; movss (%esi,%ecx,4),%xmm7
- DB 102,15,126,233 ; movd %xmm5,%ecx
- DB 139,115,8 ; mov 0x8(%ebx),%esi
- DB 33,209 ; and %edx,%ecx
- DB 137,77,228 ; mov %ecx,-0x1c(%ebp)
- DB 102,15,126,201 ; movd %xmm1,%ecx
+ DB 243,15,16,4,129 ; movss (%ecx,%eax,4),%xmm0
+ DB 102,15,126,248 ; movd %xmm7,%eax
+ DB 243,15,16,60,129 ; movss (%ecx,%eax,4),%xmm7
+ DB 102,15,126,232 ; movd %xmm5,%eax
+ DB 139,79,8 ; mov 0x8(%edi),%ecx
+ DB 33,240 ; and %esi,%eax
+ DB 137,69,228 ; mov %eax,-0x1c(%ebp)
+ DB 102,15,126,200 ; movd %xmm1,%eax
DB 102,15,112,203,229 ; pshufd $0xe5,%xmm3,%xmm1
- DB 33,209 ; and %edx,%ecx
- DB 137,77,224 ; mov %ecx,-0x20(%ebp)
- DB 102,15,126,201 ; movd %xmm1,%ecx
+ DB 33,240 ; and %esi,%eax
+ DB 137,69,224 ; mov %eax,-0x20(%ebp)
+ DB 102,15,126,200 ; movd %xmm1,%eax
DB 243,15,126,109,224 ; movq -0x20(%ebp),%xmm5
DB 102,15,97,236 ; punpcklwd %xmm4,%xmm5
DB 102,15,112,205,231 ; pshufd $0xe7,%xmm5,%xmm1
- DB 102,15,126,200 ; movd %xmm1,%eax
- DB 243,15,16,36,134 ; movss (%esi,%eax,4),%xmm4
+ DB 102,15,126,203 ; movd %xmm1,%ebx
+ DB 243,15,16,36,153 ; movss (%ecx,%ebx,4),%xmm4
DB 15,20,214 ; unpcklps %xmm6,%xmm2
DB 102,15,112,205,229 ; pshufd $0xe5,%xmm5,%xmm1
- DB 102,15,126,200 ; movd %xmm1,%eax
- DB 243,15,16,52,134 ; movss (%esi,%eax,4),%xmm6
+ DB 102,15,126,203 ; movd %xmm1,%ebx
+ DB 243,15,16,52,153 ; movss (%ecx,%ebx,4),%xmm6
DB 15,20,199 ; unpcklps %xmm7,%xmm0
- DB 102,15,126,232 ; movd %xmm5,%eax
- DB 243,15,16,12,134 ; movss (%esi,%eax,4),%xmm1
+ DB 102,15,126,235 ; movd %xmm5,%ebx
+ DB 243,15,16,12,153 ; movss (%ecx,%ebx,4),%xmm1
DB 102,15,112,237,78 ; pshufd $0x4e,%xmm5,%xmm5
- DB 102,15,126,232 ; movd %xmm5,%eax
- DB 243,15,16,44,134 ; movss (%esi,%eax,4),%xmm5
- DB 102,15,126,216 ; movd %xmm3,%eax
- DB 139,115,12 ; mov 0xc(%ebx),%esi
- DB 33,208 ; and %edx,%eax
- DB 137,69,232 ; mov %eax,-0x18(%ebp)
- DB 33,209 ; and %edx,%ecx
+ DB 102,15,126,235 ; movd %xmm5,%ebx
+ DB 243,15,16,44,153 ; movss (%ecx,%ebx,4),%xmm5
+ DB 102,15,126,217 ; movd %xmm3,%ecx
+ DB 139,127,12 ; mov 0xc(%edi),%edi
+ DB 33,241 ; and %esi,%ecx
+ DB 137,77,232 ; mov %ecx,-0x18(%ebp)
+ DB 33,240 ; and %esi,%eax
DB 15,20,194 ; unpcklps %xmm2,%xmm0
DB 15,20,244 ; unpcklps %xmm4,%xmm6
DB 15,20,205 ; unpcklps %xmm5,%xmm1
DB 15,20,206 ; unpcklps %xmm6,%xmm1
- DB 137,77,236 ; mov %ecx,-0x14(%ebp)
+ DB 137,69,236 ; mov %eax,-0x14(%ebp)
DB 243,15,126,85,232 ; movq -0x18(%ebp),%xmm2
DB 15,87,228 ; xorps %xmm4,%xmm4
DB 102,15,97,212 ; punpcklwd %xmm4,%xmm2
@@ -40787,14 +39798,14 @@ _sk_load_tables_u16_be_sse2 LABEL PROC
DB 102,15,112,226,229 ; pshufd $0xe5,%xmm2,%xmm4
DB 102,15,112,234,231 ; pshufd $0xe7,%xmm2,%xmm5
DB 102,15,126,232 ; movd %xmm5,%eax
- DB 243,15,16,44,134 ; movss (%esi,%eax,4),%xmm5
+ DB 243,15,16,44,135 ; movss (%edi,%eax,4),%xmm5
DB 102,15,126,224 ; movd %xmm4,%eax
- DB 243,15,16,36,134 ; movss (%esi,%eax,4),%xmm4
+ DB 243,15,16,36,135 ; movss (%edi,%eax,4),%xmm4
DB 102,15,126,208 ; movd %xmm2,%eax
DB 102,15,112,242,78 ; pshufd $0x4e,%xmm2,%xmm6
- DB 243,15,16,20,134 ; movss (%esi,%eax,4),%xmm2
+ DB 243,15,16,20,135 ; movss (%edi,%eax,4),%xmm2
DB 102,15,126,240 ; movd %xmm6,%eax
- DB 243,15,16,52,134 ; movss (%esi,%eax,4),%xmm6
+ DB 243,15,16,52,135 ; movss (%edi,%eax,4),%xmm6
DB 15,20,229 ; unpcklps %xmm5,%xmm4
DB 15,20,214 ; unpcklps %xmm6,%xmm2
DB 15,20,212 ; unpcklps %xmm4,%xmm2
@@ -40809,44 +39820,29 @@ _sk_load_tables_u16_be_sse2 LABEL PROC
DB 243,15,126,93,208 ; movq -0x30(%ebp),%xmm3
DB 102,15,97,223 ; punpcklwd %xmm7,%xmm3
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,159,61,95,0,0 ; mulps 0x5f3d(%edi),%xmm3
+ DB 15,89,154,144,73,0,0 ; mulps 0x4990(%edx),%xmm3
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 137,193 ; mov %eax,%ecx
DB 141,65,8 ; lea 0x8(%ecx),%eax
- DB 15,40,101,88 ; movaps 0x58(%ebp),%xmm4
- DB 15,41,100,36,80 ; movaps %xmm4,0x50(%esp)
- DB 15,40,101,72 ; movaps 0x48(%ebp),%xmm4
- DB 15,41,100,36,64 ; movaps %xmm4,0x40(%esp)
- DB 15,40,101,56 ; movaps 0x38(%ebp),%xmm4
- DB 15,41,100,36,48 ; movaps %xmm4,0x30(%esp)
- DB 15,40,101,40 ; movaps 0x28(%ebp),%xmm4
- DB 15,41,100,36,32 ; movaps %xmm4,0x20(%esp)
- DB 139,85,24 ; mov 0x18(%ebp),%edx
- DB 137,84,36,16 ; mov %edx,0x10(%esp)
- DB 139,85,20 ; mov 0x14(%ebp),%edx
- DB 137,84,36,12 ; mov %edx,0xc(%esp)
- DB 139,85,16 ; mov 0x10(%ebp),%edx
- DB 137,84,36,8 ; mov %edx,0x8(%esp)
- DB 137,68,36,4 ; mov %eax,0x4(%esp)
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 137,4,36 ; mov %eax,(%esp)
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 80 ; push %eax
+ DB 255,117,8 ; pushl 0x8(%ebp)
DB 255,81,4 ; call *0x4(%ecx)
- DB 129,196,140,0,0,0 ; add $0x8c,%esp
+ DB 131,196,60 ; add $0x3c,%esp
DB 94 ; pop %esi
DB 95 ; pop %edi
DB 91 ; pop %ebx
DB 93 ; pop %ebp
DB 195 ; ret
- DB 242,15,16,4,113 ; movsd (%ecx,%esi,2),%xmm0
+ DB 242,15,16,4,89 ; movsd (%ecx,%ebx,2),%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
- DB 139,69,24 ; mov 0x18(%ebp),%eax
DB 131,248,1 ; cmp $0x1,%eax
- DB 15,132,17,254,255,255 ; je 382f <_sk_load_tables_u16_be_sse2+0x3d>
- DB 102,15,22,68,113,8 ; movhpd 0x8(%ecx,%esi,2),%xmm0
+ DB 15,132,83,254,255,255 ; je 2afb <_sk_load_tables_u16_be_sse2+0x39>
+ DB 102,15,22,68,89,8 ; movhpd 0x8(%ecx,%ebx,2),%xmm0
DB 131,248,3 ; cmp $0x3,%eax
- DB 15,130,2,254,255,255 ; jb 382f <_sk_load_tables_u16_be_sse2+0x3d>
- DB 243,15,126,76,113,16 ; movq 0x10(%ecx,%esi,2),%xmm1
- DB 233,247,253,255,255 ; jmp 382f <_sk_load_tables_u16_be_sse2+0x3d>
+ DB 15,130,68,254,255,255 ; jb 2afb <_sk_load_tables_u16_be_sse2+0x39>
+ DB 243,15,126,76,89,16 ; movq 0x10(%ecx,%ebx,2),%xmm1
+ DB 233,57,254,255,255 ; jmp 2afb <_sk_load_tables_u16_be_sse2+0x39>
PUBLIC _sk_load_tables_rgb_u16_be_sse2
_sk_load_tables_rgb_u16_be_sse2 LABEL PROC
@@ -40855,20 +39851,21 @@ _sk_load_tables_rgb_u16_be_sse2 LABEL PROC
DB 83 ; push %ebx
DB 87 ; push %edi
DB 86 ; push %esi
- DB 131,236,124 ; sub $0x7c,%esp
- DB 232,0,0,0,0 ; call 3a46 <_sk_load_tables_rgb_u16_be_sse2+0xe>
+ DB 131,236,28 ; sub $0x1c,%esp
+ DB 232,0,0,0,0 ; call 2cd0 <_sk_load_tables_rgb_u16_be_sse2+0xe>
DB 88 ; pop %eax
DB 137,69,240 ; mov %eax,-0x10(%ebp)
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
DB 139,69,12 ; mov 0xc(%ebp),%eax
- DB 131,125,24,0 ; cmpl $0x0,0x18(%ebp)
- DB 139,24 ; mov (%eax),%ebx
- DB 139,19 ; mov (%ebx),%edx
- DB 141,60,73 ; lea (%ecx,%ecx,2),%edi
+ DB 139,85,8 ; mov 0x8(%ebp),%edx
+ DB 139,74,8 ; mov 0x8(%edx),%ecx
+ DB 107,26,3 ; imul $0x3,(%edx),%ebx
+ DB 133,201 ; test %ecx,%ecx
+ DB 139,56 ; mov (%eax),%edi
+ DB 139,7 ; mov (%edi),%eax
DB 190,255,0,255,0 ; mov $0xff00ff,%esi
- DB 15,133,198,1,0,0 ; jne 3c2c <_sk_load_tables_rgb_u16_be_sse2+0x1f4>
- DB 243,15,111,12,122 ; movdqu (%edx,%edi,2),%xmm1
- DB 243,15,111,92,122,8 ; movdqu 0x8(%edx,%edi,2),%xmm3
+ DB 15,133,141,1,0,0 ; jne 2e7e <_sk_load_tables_rgb_u16_be_sse2+0x1bc>
+ DB 243,15,111,12,88 ; movdqu (%eax,%ebx,2),%xmm1
+ DB 243,15,111,92,88,8 ; movdqu 0x8(%eax,%ebx,2),%xmm3
DB 102,15,115,219,4 ; psrldq $0x4,%xmm3
DB 102,15,111,193 ; movdqa %xmm1,%xmm0
DB 102,15,115,216,6 ; psrldq $0x6,%xmm0
@@ -40878,132 +39875,118 @@ _sk_load_tables_rgb_u16_be_sse2 LABEL PROC
DB 102,15,97,194 ; punpcklwd %xmm2,%xmm0
DB 102,15,111,209 ; movdqa %xmm1,%xmm2
DB 102,15,97,208 ; punpcklwd %xmm0,%xmm2
- DB 102,15,112,218,78 ; pshufd $0x4e,%xmm2,%xmm3
+ DB 102,15,112,226,78 ; pshufd $0x4e,%xmm2,%xmm4
DB 102,15,105,200 ; punpckhwd %xmm0,%xmm1
DB 102,15,112,194,229 ; pshufd $0xe5,%xmm2,%xmm0
- DB 102,15,126,199 ; movd %xmm0,%edi
- DB 102,15,126,208 ; movd %xmm2,%eax
- DB 102,15,112,195,229 ; pshufd $0xe5,%xmm3,%xmm0
- DB 102,15,126,194 ; movd %xmm0,%edx
+ DB 102,15,126,192 ; movd %xmm0,%eax
+ DB 102,15,126,209 ; movd %xmm2,%ecx
+ DB 102,15,112,196,229 ; pshufd $0xe5,%xmm4,%xmm0
+ DB 102,15,126,195 ; movd %xmm0,%ebx
+ DB 33,241 ; and %esi,%ecx
+ DB 137,77,216 ; mov %ecx,-0x28(%ebp)
DB 33,240 ; and %esi,%eax
- DB 137,69,216 ; mov %eax,-0x28(%ebp)
- DB 33,247 ; and %esi,%edi
- DB 137,125,220 ; mov %edi,-0x24(%ebp)
+ DB 137,69,220 ; mov %eax,-0x24(%ebp)
DB 243,15,126,69,216 ; movq -0x28(%ebp),%xmm0
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 102,15,97,194 ; punpcklwd %xmm2,%xmm0
- DB 102,15,239,246 ; pxor %xmm6,%xmm6
- DB 102,15,112,224,229 ; pshufd $0xe5,%xmm0,%xmm4
- DB 102,15,112,248,231 ; pshufd $0xe7,%xmm0,%xmm7
- DB 102,15,126,248 ; movd %xmm7,%eax
- DB 139,123,4 ; mov 0x4(%ebx),%edi
- DB 243,15,16,20,135 ; movss (%edi,%eax,4),%xmm2
- DB 102,15,126,224 ; movd %xmm4,%eax
- DB 243,15,16,60,135 ; movss (%edi,%eax,4),%xmm7
+ DB 102,15,239,255 ; pxor %xmm7,%xmm7
+ DB 102,15,112,216,229 ; pshufd $0xe5,%xmm0,%xmm3
+ DB 102,15,112,232,231 ; pshufd $0xe7,%xmm0,%xmm5
+ DB 102,15,126,232 ; movd %xmm5,%eax
+ DB 139,79,4 ; mov 0x4(%edi),%ecx
+ DB 243,15,16,52,129 ; movss (%ecx,%eax,4),%xmm6
+ DB 102,15,126,216 ; movd %xmm3,%eax
+ DB 243,15,16,20,129 ; movss (%ecx,%eax,4),%xmm2
DB 102,15,126,192 ; movd %xmm0,%eax
- DB 102,15,112,224,78 ; pshufd $0x4e,%xmm0,%xmm4
- DB 243,15,16,44,135 ; movss (%edi,%eax,4),%xmm5
+ DB 102,15,112,232,78 ; pshufd $0x4e,%xmm0,%xmm5
+ DB 243,15,16,28,129 ; movss (%ecx,%eax,4),%xmm3
+ DB 102,15,126,232 ; movd %xmm5,%eax
+ DB 243,15,16,44,129 ; movss (%ecx,%eax,4),%xmm5
DB 102,15,126,224 ; movd %xmm4,%eax
- DB 243,15,16,36,135 ; movss (%edi,%eax,4),%xmm4
- DB 102,15,126,216 ; movd %xmm3,%eax
- DB 102,15,112,217,229 ; pshufd $0xe5,%xmm1,%xmm3
- DB 139,123,8 ; mov 0x8(%ebx),%edi
+ DB 102,15,112,225,229 ; pshufd $0xe5,%xmm1,%xmm4
+ DB 139,79,8 ; mov 0x8(%edi),%ecx
DB 33,240 ; and %esi,%eax
DB 137,69,224 ; mov %eax,-0x20(%ebp)
- DB 102,15,126,216 ; movd %xmm3,%eax
- DB 33,242 ; and %esi,%edx
- DB 137,85,228 ; mov %edx,-0x1c(%ebp)
- DB 243,15,126,93,224 ; movq -0x20(%ebp),%xmm3
- DB 102,15,97,222 ; punpcklwd %xmm6,%xmm3
- DB 102,15,112,243,231 ; pshufd $0xe7,%xmm3,%xmm6
- DB 102,15,126,242 ; movd %xmm6,%edx
- DB 243,15,16,52,151 ; movss (%edi,%edx,4),%xmm6
+ DB 102,15,126,224 ; movd %xmm4,%eax
+ DB 33,243 ; and %esi,%ebx
+ DB 137,93,228 ; mov %ebx,-0x1c(%ebp)
+ DB 243,15,126,101,224 ; movq -0x20(%ebp),%xmm4
+ DB 102,15,97,231 ; punpcklwd %xmm7,%xmm4
+ DB 102,15,112,252,231 ; pshufd $0xe7,%xmm4,%xmm7
+ DB 102,15,126,251 ; movd %xmm7,%ebx
+ DB 243,15,16,60,153 ; movss (%ecx,%ebx,4),%xmm7
+ DB 102,15,126,203 ; movd %xmm1,%ebx
+ DB 102,15,112,204,229 ; pshufd $0xe5,%xmm4,%xmm1
DB 102,15,126,202 ; movd %xmm1,%edx
- DB 102,15,112,203,229 ; pshufd $0xe5,%xmm3,%xmm1
- DB 102,15,126,201 ; movd %xmm1,%ecx
- DB 243,15,16,4,143 ; movss (%edi,%ecx,4),%xmm0
- DB 15,20,250 ; unpcklps %xmm2,%xmm7
- DB 102,15,126,217 ; movd %xmm3,%ecx
- DB 243,15,16,12,143 ; movss (%edi,%ecx,4),%xmm1
- DB 102,15,112,211,78 ; pshufd $0x4e,%xmm3,%xmm2
- DB 102,15,126,209 ; movd %xmm2,%ecx
- DB 243,15,16,28,143 ; movss (%edi,%ecx,4),%xmm3
- DB 139,75,12 ; mov 0xc(%ebx),%ecx
- DB 33,242 ; and %esi,%edx
- DB 137,85,232 ; mov %edx,-0x18(%ebp)
+ DB 243,15,16,4,145 ; movss (%ecx,%edx,4),%xmm0
+ DB 15,20,214 ; unpcklps %xmm6,%xmm2
+ DB 102,15,126,226 ; movd %xmm4,%edx
+ DB 243,15,16,12,145 ; movss (%ecx,%edx,4),%xmm1
+ DB 102,15,112,228,78 ; pshufd $0x4e,%xmm4,%xmm4
+ DB 102,15,126,226 ; movd %xmm4,%edx
+ DB 243,15,16,36,145 ; movss (%ecx,%edx,4),%xmm4
+ DB 139,79,12 ; mov 0xc(%edi),%ecx
+ DB 33,243 ; and %esi,%ebx
+ DB 137,93,232 ; mov %ebx,-0x18(%ebp)
DB 33,240 ; and %esi,%eax
- DB 15,20,236 ; unpcklps %xmm4,%xmm5
- DB 15,20,239 ; unpcklps %xmm7,%xmm5
- DB 15,20,198 ; unpcklps %xmm6,%xmm0
+ DB 15,20,221 ; unpcklps %xmm5,%xmm3
+ DB 15,20,218 ; unpcklps %xmm2,%xmm3
+ DB 15,20,199 ; unpcklps %xmm7,%xmm0
DB 137,69,236 ; mov %eax,-0x14(%ebp)
DB 243,15,126,85,232 ; movq -0x18(%ebp),%xmm2
- DB 15,87,228 ; xorps %xmm4,%xmm4
- DB 102,15,97,212 ; punpcklwd %xmm4,%xmm2
- DB 102,15,112,226,229 ; pshufd $0xe5,%xmm2,%xmm4
+ DB 15,87,237 ; xorps %xmm5,%xmm5
+ DB 102,15,97,213 ; punpcklwd %xmm5,%xmm2
+ DB 102,15,112,234,229 ; pshufd $0xe5,%xmm2,%xmm5
DB 102,15,112,242,231 ; pshufd $0xe7,%xmm2,%xmm6
DB 102,15,126,240 ; movd %xmm6,%eax
DB 243,15,16,52,129 ; movss (%ecx,%eax,4),%xmm6
- DB 102,15,126,224 ; movd %xmm4,%eax
- DB 243,15,16,36,129 ; movss (%ecx,%eax,4),%xmm4
+ DB 102,15,126,232 ; movd %xmm5,%eax
+ DB 243,15,16,44,129 ; movss (%ecx,%eax,4),%xmm5
DB 102,15,126,208 ; movd %xmm2,%eax
DB 102,15,112,250,78 ; pshufd $0x4e,%xmm2,%xmm7
DB 243,15,16,20,129 ; movss (%ecx,%eax,4),%xmm2
DB 102,15,126,248 ; movd %xmm7,%eax
DB 243,15,16,60,129 ; movss (%ecx,%eax,4),%xmm7
- DB 15,20,203 ; unpcklps %xmm3,%xmm1
+ DB 15,20,204 ; unpcklps %xmm4,%xmm1
DB 15,20,200 ; unpcklps %xmm0,%xmm1
- DB 15,20,230 ; unpcklps %xmm6,%xmm4
+ DB 15,20,238 ; unpcklps %xmm6,%xmm5
DB 15,20,215 ; unpcklps %xmm7,%xmm2
- DB 15,20,212 ; unpcklps %xmm4,%xmm2
+ DB 15,20,213 ; unpcklps %xmm5,%xmm2
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 137,193 ; mov %eax,%ecx
DB 141,65,8 ; lea 0x8(%ecx),%eax
- DB 15,40,69,88 ; movaps 0x58(%ebp),%xmm0
- DB 15,41,68,36,80 ; movaps %xmm0,0x50(%esp)
- DB 15,40,69,72 ; movaps 0x48(%ebp),%xmm0
- DB 15,41,68,36,64 ; movaps %xmm0,0x40(%esp)
- DB 15,40,69,56 ; movaps 0x38(%ebp),%xmm0
- DB 15,41,68,36,48 ; movaps %xmm0,0x30(%esp)
- DB 15,40,69,40 ; movaps 0x28(%ebp),%xmm0
- DB 15,41,68,36,32 ; movaps %xmm0,0x20(%esp)
- DB 139,85,24 ; mov 0x18(%ebp),%edx
- DB 137,84,36,16 ; mov %edx,0x10(%esp)
- DB 139,85,20 ; mov 0x14(%ebp),%edx
- DB 137,84,36,12 ; mov %edx,0xc(%esp)
- DB 139,85,16 ; mov 0x10(%ebp),%edx
- DB 137,84,36,8 ; mov %edx,0x8(%esp)
- DB 137,68,36,4 ; mov %eax,0x4(%esp)
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 137,4,36 ; mov %eax,(%esp)
- DB 139,69,240 ; mov -0x10(%ebp),%eax
- DB 15,40,152,10,93,0,0 ; movaps 0x5d0a(%eax),%xmm3
- DB 15,40,197 ; movaps %xmm5,%xmm0
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 139,85,240 ; mov -0x10(%ebp),%edx
+ DB 15,40,162,160,71,0,0 ; movaps 0x47a0(%edx),%xmm4
+ DB 15,40,195 ; movaps %xmm3,%xmm0
+ DB 15,40,220 ; movaps %xmm4,%xmm3
+ DB 80 ; push %eax
+ DB 255,117,8 ; pushl 0x8(%ebp)
DB 255,81,4 ; call *0x4(%ecx)
- DB 131,196,124 ; add $0x7c,%esp
+ DB 131,196,44 ; add $0x2c,%esp
DB 94 ; pop %esi
DB 95 ; pop %edi
DB 91 ; pop %ebx
DB 93 ; pop %ebp
DB 195 ; ret
- DB 102,15,110,12,122 ; movd (%edx,%edi,2),%xmm1
- DB 102,15,196,76,122,4,2 ; pinsrw $0x2,0x4(%edx,%edi,2),%xmm1
+ DB 102,15,110,12,88 ; movd (%eax,%ebx,2),%xmm1
+ DB 102,15,196,76,88,4,2 ; pinsrw $0x2,0x4(%eax,%ebx,2),%xmm1
DB 102,15,239,210 ; pxor %xmm2,%xmm2
- DB 139,69,24 ; mov 0x18(%ebp),%eax
- DB 131,248,1 ; cmp $0x1,%eax
- DB 117,13 ; jne 3c51 <_sk_load_tables_rgb_u16_be_sse2+0x219>
+ DB 131,249,1 ; cmp $0x1,%ecx
+ DB 117,13 ; jne 2ea0 <_sk_load_tables_rgb_u16_be_sse2+0x1de>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 102,15,239,192 ; pxor %xmm0,%xmm0
- DB 233,55,254,255,255 ; jmp 3a88 <_sk_load_tables_rgb_u16_be_sse2+0x50>
- DB 102,15,110,68,122,6 ; movd 0x6(%edx,%edi,2),%xmm0
- DB 102,15,196,68,122,10,2 ; pinsrw $0x2,0xa(%edx,%edi,2),%xmm0
+ DB 233,115,254,255,255 ; jmp 2d13 <_sk_load_tables_rgb_u16_be_sse2+0x51>
+ DB 102,15,110,68,88,6 ; movd 0x6(%eax,%ebx,2),%xmm0
+ DB 102,15,196,68,88,10,2 ; pinsrw $0x2,0xa(%eax,%ebx,2),%xmm0
DB 102,15,239,210 ; pxor %xmm2,%xmm2
- DB 131,248,3 ; cmp $0x3,%eax
- DB 114,18 ; jb 3c79 <_sk_load_tables_rgb_u16_be_sse2+0x241>
- DB 102,15,110,92,122,12 ; movd 0xc(%edx,%edi,2),%xmm3
- DB 102,15,196,92,122,16,2 ; pinsrw $0x2,0x10(%edx,%edi,2),%xmm3
- DB 233,15,254,255,255 ; jmp 3a88 <_sk_load_tables_rgb_u16_be_sse2+0x50>
+ DB 131,249,3 ; cmp $0x3,%ecx
+ DB 114,18 ; jb 2ec8 <_sk_load_tables_rgb_u16_be_sse2+0x206>
+ DB 102,15,110,92,88,12 ; movd 0xc(%eax,%ebx,2),%xmm3
+ DB 102,15,196,92,88,16,2 ; pinsrw $0x2,0x10(%eax,%ebx,2),%xmm3
+ DB 233,75,254,255,255 ; jmp 2d13 <_sk_load_tables_rgb_u16_be_sse2+0x51>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
- DB 233,6,254,255,255 ; jmp 3a88 <_sk_load_tables_rgb_u16_be_sse2+0x50>
+ DB 233,66,254,255,255 ; jmp 2d13 <_sk_load_tables_rgb_u16_be_sse2+0x51>
PUBLIC _sk_byte_tables_sse2
_sk_byte_tables_sse2 LABEL PROC
@@ -41012,35 +39995,35 @@ _sk_byte_tables_sse2 LABEL PROC
DB 83 ; push %ebx
DB 87 ; push %edi
DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 232,0,0,0,0 ; call 3c90 <_sk_byte_tables_sse2+0xe>
+ DB 131,236,12 ; sub $0xc,%esp
+ DB 232,0,0,0,0 ; call 2edf <_sk_byte_tables_sse2+0xe>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,8 ; mov (%eax),%ecx
- DB 15,40,170,208,90,0,0 ; movaps 0x5ad0(%edx),%xmm5
- DB 15,89,197 ; mulps %xmm5,%xmm0
+ DB 15,40,162,161,69,0,0 ; movaps 0x45a1(%edx),%xmm4
+ DB 15,89,196 ; mulps %xmm4,%xmm0
DB 102,15,91,192 ; cvtps2dq %xmm0,%xmm0
- DB 102,15,112,224,78 ; pshufd $0x4e,%xmm0,%xmm4
- DB 102,15,126,230 ; movd %xmm4,%esi
- DB 102,15,112,224,231 ; pshufd $0xe7,%xmm0,%xmm4
+ DB 102,15,112,232,78 ; pshufd $0x4e,%xmm0,%xmm5
+ DB 102,15,126,238 ; movd %xmm5,%esi
+ DB 102,15,112,232,231 ; pshufd $0xe7,%xmm0,%xmm5
DB 139,57 ; mov (%ecx),%edi
DB 15,182,52,55 ; movzbl (%edi,%esi,1),%esi
- DB 102,15,126,227 ; movd %xmm4,%ebx
+ DB 102,15,126,235 ; movd %xmm5,%ebx
DB 15,182,28,31 ; movzbl (%edi,%ebx,1),%ebx
DB 193,227,8 ; shl $0x8,%ebx
DB 9,243 ; or %esi,%ebx
- DB 102,15,112,224,229 ; pshufd $0xe5,%xmm0,%xmm4
+ DB 102,15,112,232,229 ; pshufd $0xe5,%xmm0,%xmm5
DB 102,15,126,198 ; movd %xmm0,%esi
DB 15,182,52,55 ; movzbl (%edi,%esi,1),%esi
- DB 102,15,126,224 ; movd %xmm4,%eax
+ DB 102,15,126,232 ; movd %xmm5,%eax
DB 15,182,4,7 ; movzbl (%edi,%eax,1),%eax
DB 193,224,8 ; shl $0x8,%eax
DB 9,240 ; or %esi,%eax
DB 102,15,196,192,0 ; pinsrw $0x0,%eax,%xmm0
DB 139,65,4 ; mov 0x4(%ecx),%eax
DB 102,15,196,195,1 ; pinsrw $0x1,%ebx,%xmm0
- DB 15,40,162,224,90,0,0 ; movaps 0x5ae0(%edx),%xmm4
- DB 15,89,205 ; mulps %xmm5,%xmm1
+ DB 15,40,170,177,69,0,0 ; movaps 0x45b1(%edx),%xmm5
+ DB 15,89,204 ; mulps %xmm4,%xmm1
DB 102,15,91,201 ; cvtps2dq %xmm1,%xmm1
DB 102,15,112,241,78 ; pshufd $0x4e,%xmm1,%xmm6
DB 102,15,126,242 ; movd %xmm6,%edx
@@ -41060,7 +40043,7 @@ _sk_byte_tables_sse2 LABEL PROC
DB 102,15,196,200,0 ; pinsrw $0x0,%eax,%xmm1
DB 102,15,196,206,1 ; pinsrw $0x1,%esi,%xmm1
DB 139,65,8 ; mov 0x8(%ecx),%eax
- DB 15,89,213 ; mulps %xmm5,%xmm2
+ DB 15,89,212 ; mulps %xmm4,%xmm2
DB 102,15,91,210 ; cvtps2dq %xmm2,%xmm2
DB 102,15,112,242,78 ; pshufd $0x4e,%xmm2,%xmm6
DB 102,15,126,242 ; movd %xmm6,%edx
@@ -41080,10 +40063,10 @@ _sk_byte_tables_sse2 LABEL PROC
DB 102,15,196,208,0 ; pinsrw $0x0,%eax,%xmm2
DB 102,15,196,214,1 ; pinsrw $0x1,%esi,%xmm2
DB 139,65,12 ; mov 0xc(%ecx),%eax
- DB 15,89,221 ; mulps %xmm5,%xmm3
+ DB 15,89,220 ; mulps %xmm4,%xmm3
DB 102,15,91,219 ; cvtps2dq %xmm3,%xmm3
DB 102,15,126,217 ; movd %xmm3,%ecx
- DB 102,15,112,235,229 ; pshufd $0xe5,%xmm3,%xmm5
+ DB 102,15,112,227,229 ; pshufd $0xe5,%xmm3,%xmm4
DB 102,15,112,243,78 ; pshufd $0x4e,%xmm3,%xmm6
DB 102,15,126,242 ; movd %xmm6,%edx
DB 102,15,112,219,231 ; pshufd $0xe7,%xmm3,%xmm3
@@ -41092,51 +40075,37 @@ _sk_byte_tables_sse2 LABEL PROC
DB 15,182,52,48 ; movzbl (%eax,%esi,1),%esi
DB 193,230,8 ; shl $0x8,%esi
DB 9,214 ; or %edx,%esi
- DB 102,15,126,234 ; movd %xmm5,%edx
+ DB 102,15,126,226 ; movd %xmm4,%edx
DB 15,182,12,8 ; movzbl (%eax,%ecx,1),%ecx
DB 15,182,4,16 ; movzbl (%eax,%edx,1),%eax
- DB 139,85,8 ; mov 0x8(%ebp),%edx
DB 193,224,8 ; shl $0x8,%eax
DB 9,200 ; or %ecx,%eax
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
DB 102,15,196,216,0 ; pinsrw $0x0,%eax,%xmm3
- DB 139,69,20 ; mov 0x14(%ebp),%eax
- DB 102,15,196,222,1 ; pinsrw $0x1,%esi,%xmm3
- DB 139,117,24 ; mov 0x18(%ebp),%esi
- DB 15,40,109,40 ; movaps 0x28(%ebp),%xmm5
- DB 15,40,117,56 ; movaps 0x38(%ebp),%xmm6
- DB 102,15,239,255 ; pxor %xmm7,%xmm7
- DB 102,15,96,199 ; punpcklbw %xmm7,%xmm0
- DB 102,15,97,199 ; punpcklwd %xmm7,%xmm0
- DB 102,15,96,207 ; punpcklbw %xmm7,%xmm1
- DB 102,15,97,207 ; punpcklwd %xmm7,%xmm1
- DB 102,15,96,215 ; punpcklbw %xmm7,%xmm2
- DB 102,15,97,215 ; punpcklwd %xmm7,%xmm2
- DB 102,15,96,223 ; punpcklbw %xmm7,%xmm3
- DB 102,15,97,223 ; punpcklwd %xmm7,%xmm3
- DB 15,40,125,72 ; movaps 0x48(%ebp),%xmm7
+ DB 102,15,239,228 ; pxor %xmm4,%xmm4
+ DB 102,15,96,196 ; punpcklbw %xmm4,%xmm0
+ DB 102,15,97,196 ; punpcklwd %xmm4,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,196 ; mulps %xmm4,%xmm0
+ DB 15,89,197 ; mulps %xmm5,%xmm0
+ DB 102,15,96,204 ; punpcklbw %xmm4,%xmm1
+ DB 102,15,97,204 ; punpcklwd %xmm4,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,204 ; mulps %xmm4,%xmm1
+ DB 15,89,205 ; mulps %xmm5,%xmm1
+ DB 102,15,96,212 ; punpcklbw %xmm4,%xmm2
+ DB 102,15,97,212 ; punpcklwd %xmm4,%xmm2
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,212 ; mulps %xmm4,%xmm2
+ DB 15,89,213 ; mulps %xmm5,%xmm2
+ DB 102,15,196,222,1 ; pinsrw $0x1,%esi,%xmm3
+ DB 102,15,96,220 ; punpcklbw %xmm4,%xmm3
+ DB 102,15,97,220 ; punpcklwd %xmm4,%xmm3
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,220 ; mulps %xmm4,%xmm3
- DB 15,40,101,88 ; movaps 0x58(%ebp),%xmm4
- DB 139,93,12 ; mov 0xc(%ebp),%ebx
- DB 141,123,8 ; lea 0x8(%ebx),%edi
- DB 15,41,100,36,80 ; movaps %xmm4,0x50(%esp)
- DB 15,41,124,36,64 ; movaps %xmm7,0x40(%esp)
- DB 15,41,116,36,48 ; movaps %xmm6,0x30(%esp)
- DB 15,41,108,36,32 ; movaps %xmm5,0x20(%esp)
- DB 137,116,36,16 ; mov %esi,0x10(%esp)
- DB 137,68,36,12 ; mov %eax,0xc(%esp)
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,124,36,4 ; mov %edi,0x4(%esp)
- DB 137,20,36 ; mov %edx,(%esp)
- DB 255,83,4 ; call *0x4(%ebx)
- DB 131,196,108 ; add $0x6c,%esp
+ DB 15,89,221 ; mulps %xmm5,%xmm3
+ DB 139,77,12 ; mov 0xc(%ebp),%ecx
+ DB 141,65,8 ; lea 0x8(%ecx),%eax
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 80 ; push %eax
+ DB 255,117,8 ; pushl 0x8(%ebp)
+ DB 255,81,4 ; call *0x4(%ecx)
+ DB 131,196,28 ; add $0x1c,%esp
DB 94 ; pop %esi
DB 95 ; pop %edi
DB 91 ; pop %ebx
@@ -41150,7 +40119,7 @@ _sk_byte_tables_rgb_sse2 LABEL PROC
DB 83 ; push %ebx
DB 87 ; push %edi
DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
+ DB 131,236,12 ; sub $0xc,%esp
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,8 ; mov (%eax),%ecx
DB 139,81,12 ; mov 0xc(%ecx),%edx
@@ -41176,12 +40145,12 @@ _sk_byte_tables_rgb_sse2 LABEL PROC
DB 15,182,60,31 ; movzbl (%edi,%ebx,1),%edi
DB 193,231,8 ; shl $0x8,%edi
DB 9,215 ; or %edx,%edi
- DB 232,0,0,0,0 ; call 3ecc <_sk_byte_tables_rgb_sse2+0x65>
+ DB 232,0,0,0,0 ; call 30df <_sk_byte_tables_rgb_sse2+0x65>
DB 90 ; pop %edx
DB 102,15,196,199,0 ; pinsrw $0x0,%edi,%xmm0
DB 139,121,4 ; mov 0x4(%ecx),%edi
DB 102,15,196,198,1 ; pinsrw $0x1,%esi,%xmm0
- DB 15,40,170,180,88,0,0 ; movaps 0x58b4(%edx),%xmm5
+ DB 15,40,170,193,67,0,0 ; movaps 0x43c1(%edx),%xmm5
DB 15,89,204 ; mulps %xmm4,%xmm1
DB 102,15,91,201 ; cvtps2dq %xmm1,%xmm1
DB 102,15,112,241,78 ; pshufd $0x4e,%xmm1,%xmm6
@@ -41217,43 +40186,29 @@ _sk_byte_tables_rgb_sse2 LABEL PROC
DB 102,15,126,230 ; movd %xmm4,%esi
DB 15,182,20,17 ; movzbl (%ecx,%edx,1),%edx
DB 15,182,12,49 ; movzbl (%ecx,%esi,1),%ecx
- DB 139,117,8 ; mov 0x8(%ebp),%esi
DB 193,225,8 ; shl $0x8,%ecx
DB 9,209 ; or %edx,%ecx
- DB 139,85,16 ; mov 0x10(%ebp),%edx
DB 102,15,196,209,0 ; pinsrw $0x0,%ecx,%xmm2
- DB 139,77,20 ; mov 0x14(%ebp),%ecx
- DB 102,15,196,215,1 ; pinsrw $0x1,%edi,%xmm2
- DB 139,125,24 ; mov 0x18(%ebp),%edi
- DB 15,40,101,40 ; movaps 0x28(%ebp),%xmm4
- DB 15,40,117,56 ; movaps 0x38(%ebp),%xmm6
- DB 102,15,239,255 ; pxor %xmm7,%xmm7
- DB 102,15,96,199 ; punpcklbw %xmm7,%xmm0
- DB 102,15,97,199 ; punpcklwd %xmm7,%xmm0
- DB 102,15,96,207 ; punpcklbw %xmm7,%xmm1
- DB 102,15,97,207 ; punpcklwd %xmm7,%xmm1
- DB 102,15,96,215 ; punpcklbw %xmm7,%xmm2
- DB 102,15,97,215 ; punpcklwd %xmm7,%xmm2
- DB 15,40,125,72 ; movaps 0x48(%ebp),%xmm7
+ DB 102,15,239,228 ; pxor %xmm4,%xmm4
+ DB 102,15,96,196 ; punpcklbw %xmm4,%xmm0
+ DB 102,15,97,196 ; punpcklwd %xmm4,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
DB 15,89,197 ; mulps %xmm5,%xmm0
+ DB 102,15,96,204 ; punpcklbw %xmm4,%xmm1
+ DB 102,15,97,204 ; punpcklwd %xmm4,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
DB 15,89,205 ; mulps %xmm5,%xmm1
+ DB 102,15,196,215,1 ; pinsrw $0x1,%edi,%xmm2
+ DB 102,15,96,212 ; punpcklbw %xmm4,%xmm2
+ DB 102,15,97,212 ; punpcklwd %xmm4,%xmm2
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
DB 15,89,213 ; mulps %xmm5,%xmm2
- DB 15,40,109,88 ; movaps 0x58(%ebp),%xmm5
- DB 141,88,8 ; lea 0x8(%eax),%ebx
- DB 15,41,108,36,80 ; movaps %xmm5,0x50(%esp)
- DB 15,41,124,36,64 ; movaps %xmm7,0x40(%esp)
- DB 15,41,116,36,48 ; movaps %xmm6,0x30(%esp)
- DB 15,41,100,36,32 ; movaps %xmm4,0x20(%esp)
- DB 137,124,36,16 ; mov %edi,0x10(%esp)
- DB 137,76,36,12 ; mov %ecx,0xc(%esp)
- DB 137,84,36,8 ; mov %edx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,52,36 ; mov %esi,(%esp)
+ DB 141,72,8 ; lea 0x8(%eax),%ecx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 81 ; push %ecx
+ DB 255,117,8 ; pushl 0x8(%ebp)
DB 255,80,4 ; call *0x4(%eax)
- DB 131,196,108 ; add $0x6c,%esp
+ DB 131,196,28 ; add $0x1c,%esp
DB 94 ; pop %esi
DB 95 ; pop %edi
DB 91 ; pop %ebx
@@ -41264,57 +40219,37 @@ PUBLIC _sk_table_r_sse2
_sk_table_r_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
- DB 139,85,12 ; mov 0xc(%ebp),%edx
- DB 139,50 ; mov (%edx),%esi
- DB 139,62 ; mov (%esi),%edi
- DB 139,118,4 ; mov 0x4(%esi),%esi
- DB 78 ; dec %esi
- DB 102,15,110,230 ; movd %esi,%xmm4
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 139,69,12 ; mov 0xc(%ebp),%eax
+ DB 139,8 ; mov (%eax),%ecx
+ DB 139,17 ; mov (%ecx),%edx
+ DB 139,73,4 ; mov 0x4(%ecx),%ecx
+ DB 73 ; dec %ecx
+ DB 102,15,110,225 ; movd %ecx,%xmm4
DB 102,15,112,228,0 ; pshufd $0x0,%xmm4,%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
DB 15,89,224 ; mulps %xmm0,%xmm4
DB 102,15,91,196 ; cvtps2dq %xmm4,%xmm0
DB 102,15,112,224,229 ; pshufd $0xe5,%xmm0,%xmm4
DB 102,15,112,232,231 ; pshufd $0xe7,%xmm0,%xmm5
- DB 102,15,126,238 ; movd %xmm5,%esi
- DB 243,15,16,44,183 ; movss (%edi,%esi,4),%xmm5
- DB 102,15,126,230 ; movd %xmm4,%esi
- DB 243,15,16,36,183 ; movss (%edi,%esi,4),%xmm4
- DB 102,15,126,198 ; movd %xmm0,%esi
+ DB 102,15,126,233 ; movd %xmm5,%ecx
+ DB 243,15,16,44,138 ; movss (%edx,%ecx,4),%xmm5
+ DB 102,15,126,225 ; movd %xmm4,%ecx
+ DB 243,15,16,36,138 ; movss (%edx,%ecx,4),%xmm4
+ DB 102,15,126,193 ; movd %xmm0,%ecx
DB 102,15,112,240,78 ; pshufd $0x4e,%xmm0,%xmm6
- DB 243,15,16,4,183 ; movss (%edi,%esi,4),%xmm0
- DB 102,15,126,246 ; movd %xmm6,%esi
- DB 243,15,16,52,183 ; movss (%edi,%esi,4),%xmm6
- DB 139,117,20 ; mov 0x14(%ebp),%esi
- DB 139,125,24 ; mov 0x18(%ebp),%edi
- DB 15,40,125,40 ; movaps 0x28(%ebp),%xmm7
+ DB 243,15,16,4,138 ; movss (%edx,%ecx,4),%xmm0
+ DB 102,15,126,241 ; movd %xmm6,%ecx
+ DB 243,15,16,52,138 ; movss (%edx,%ecx,4),%xmm6
DB 15,20,229 ; unpcklps %xmm5,%xmm4
- DB 15,40,109,56 ; movaps 0x38(%ebp),%xmm5
DB 15,20,198 ; unpcklps %xmm6,%xmm0
- DB 15,40,117,72 ; movaps 0x48(%ebp),%xmm6
DB 15,20,196 ; unpcklps %xmm4,%xmm0
- DB 15,40,101,88 ; movaps 0x58(%ebp),%xmm4
- DB 141,90,8 ; lea 0x8(%edx),%ebx
- DB 15,41,100,36,80 ; movaps %xmm4,0x50(%esp)
- DB 15,41,116,36,64 ; movaps %xmm6,0x40(%esp)
- DB 15,41,108,36,48 ; movaps %xmm5,0x30(%esp)
- DB 15,41,124,36,32 ; movaps %xmm7,0x20(%esp)
- DB 137,124,36,16 ; mov %edi,0x10(%esp)
- DB 137,116,36,12 ; mov %esi,0xc(%esp)
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
- DB 255,82,4 ; call *0x4(%edx)
- DB 131,196,108 ; add $0x6c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 141,72,8 ; lea 0x8(%eax),%ecx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 81 ; push %ecx
+ DB 255,117,8 ; pushl 0x8(%ebp)
+ DB 255,80,4 ; call *0x4(%eax)
+ DB 131,196,24 ; add $0x18,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -41322,57 +40257,37 @@ PUBLIC _sk_table_g_sse2
_sk_table_g_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
- DB 139,85,12 ; mov 0xc(%ebp),%edx
- DB 139,50 ; mov (%edx),%esi
- DB 139,62 ; mov (%esi),%edi
- DB 139,118,4 ; mov 0x4(%esi),%esi
- DB 78 ; dec %esi
- DB 102,15,110,230 ; movd %esi,%xmm4
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 139,69,12 ; mov 0xc(%ebp),%eax
+ DB 139,8 ; mov (%eax),%ecx
+ DB 139,17 ; mov (%ecx),%edx
+ DB 139,73,4 ; mov 0x4(%ecx),%ecx
+ DB 73 ; dec %ecx
+ DB 102,15,110,225 ; movd %ecx,%xmm4
DB 102,15,112,228,0 ; pshufd $0x0,%xmm4,%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
DB 15,89,225 ; mulps %xmm1,%xmm4
DB 102,15,91,204 ; cvtps2dq %xmm4,%xmm1
DB 102,15,112,225,229 ; pshufd $0xe5,%xmm1,%xmm4
DB 102,15,112,233,231 ; pshufd $0xe7,%xmm1,%xmm5
- DB 102,15,126,238 ; movd %xmm5,%esi
- DB 243,15,16,44,183 ; movss (%edi,%esi,4),%xmm5
- DB 102,15,126,230 ; movd %xmm4,%esi
- DB 243,15,16,36,183 ; movss (%edi,%esi,4),%xmm4
- DB 102,15,126,206 ; movd %xmm1,%esi
+ DB 102,15,126,233 ; movd %xmm5,%ecx
+ DB 243,15,16,44,138 ; movss (%edx,%ecx,4),%xmm5
+ DB 102,15,126,225 ; movd %xmm4,%ecx
+ DB 243,15,16,36,138 ; movss (%edx,%ecx,4),%xmm4
+ DB 102,15,126,201 ; movd %xmm1,%ecx
DB 102,15,112,241,78 ; pshufd $0x4e,%xmm1,%xmm6
- DB 243,15,16,12,183 ; movss (%edi,%esi,4),%xmm1
- DB 102,15,126,246 ; movd %xmm6,%esi
- DB 243,15,16,52,183 ; movss (%edi,%esi,4),%xmm6
- DB 139,117,20 ; mov 0x14(%ebp),%esi
- DB 139,125,24 ; mov 0x18(%ebp),%edi
- DB 15,40,125,40 ; movaps 0x28(%ebp),%xmm7
+ DB 243,15,16,12,138 ; movss (%edx,%ecx,4),%xmm1
+ DB 102,15,126,241 ; movd %xmm6,%ecx
+ DB 243,15,16,52,138 ; movss (%edx,%ecx,4),%xmm6
DB 15,20,229 ; unpcklps %xmm5,%xmm4
- DB 15,40,109,56 ; movaps 0x38(%ebp),%xmm5
DB 15,20,206 ; unpcklps %xmm6,%xmm1
- DB 15,40,117,72 ; movaps 0x48(%ebp),%xmm6
DB 15,20,204 ; unpcklps %xmm4,%xmm1
- DB 15,40,101,88 ; movaps 0x58(%ebp),%xmm4
- DB 141,90,8 ; lea 0x8(%edx),%ebx
- DB 15,41,100,36,80 ; movaps %xmm4,0x50(%esp)
- DB 15,41,116,36,64 ; movaps %xmm6,0x40(%esp)
- DB 15,41,108,36,48 ; movaps %xmm5,0x30(%esp)
- DB 15,41,124,36,32 ; movaps %xmm7,0x20(%esp)
- DB 137,124,36,16 ; mov %edi,0x10(%esp)
- DB 137,116,36,12 ; mov %esi,0xc(%esp)
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
- DB 255,82,4 ; call *0x4(%edx)
- DB 131,196,108 ; add $0x6c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 141,72,8 ; lea 0x8(%eax),%ecx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 81 ; push %ecx
+ DB 255,117,8 ; pushl 0x8(%ebp)
+ DB 255,80,4 ; call *0x4(%eax)
+ DB 131,196,24 ; add $0x18,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -41380,57 +40295,37 @@ PUBLIC _sk_table_b_sse2
_sk_table_b_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
- DB 139,85,12 ; mov 0xc(%ebp),%edx
- DB 139,50 ; mov (%edx),%esi
- DB 139,62 ; mov (%esi),%edi
- DB 139,118,4 ; mov 0x4(%esi),%esi
- DB 78 ; dec %esi
- DB 102,15,110,230 ; movd %esi,%xmm4
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 139,69,12 ; mov 0xc(%ebp),%eax
+ DB 139,8 ; mov (%eax),%ecx
+ DB 139,17 ; mov (%ecx),%edx
+ DB 139,73,4 ; mov 0x4(%ecx),%ecx
+ DB 73 ; dec %ecx
+ DB 102,15,110,225 ; movd %ecx,%xmm4
DB 102,15,112,228,0 ; pshufd $0x0,%xmm4,%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
DB 15,89,226 ; mulps %xmm2,%xmm4
DB 102,15,91,212 ; cvtps2dq %xmm4,%xmm2
DB 102,15,112,226,229 ; pshufd $0xe5,%xmm2,%xmm4
DB 102,15,112,234,231 ; pshufd $0xe7,%xmm2,%xmm5
- DB 102,15,126,238 ; movd %xmm5,%esi
- DB 243,15,16,44,183 ; movss (%edi,%esi,4),%xmm5
- DB 102,15,126,230 ; movd %xmm4,%esi
- DB 243,15,16,36,183 ; movss (%edi,%esi,4),%xmm4
- DB 102,15,126,214 ; movd %xmm2,%esi
+ DB 102,15,126,233 ; movd %xmm5,%ecx
+ DB 243,15,16,44,138 ; movss (%edx,%ecx,4),%xmm5
+ DB 102,15,126,225 ; movd %xmm4,%ecx
+ DB 243,15,16,36,138 ; movss (%edx,%ecx,4),%xmm4
+ DB 102,15,126,209 ; movd %xmm2,%ecx
DB 102,15,112,242,78 ; pshufd $0x4e,%xmm2,%xmm6
- DB 243,15,16,20,183 ; movss (%edi,%esi,4),%xmm2
- DB 102,15,126,246 ; movd %xmm6,%esi
- DB 243,15,16,52,183 ; movss (%edi,%esi,4),%xmm6
- DB 139,117,20 ; mov 0x14(%ebp),%esi
- DB 139,125,24 ; mov 0x18(%ebp),%edi
- DB 15,40,125,40 ; movaps 0x28(%ebp),%xmm7
+ DB 243,15,16,20,138 ; movss (%edx,%ecx,4),%xmm2
+ DB 102,15,126,241 ; movd %xmm6,%ecx
+ DB 243,15,16,52,138 ; movss (%edx,%ecx,4),%xmm6
DB 15,20,229 ; unpcklps %xmm5,%xmm4
- DB 15,40,109,56 ; movaps 0x38(%ebp),%xmm5
DB 15,20,214 ; unpcklps %xmm6,%xmm2
- DB 15,40,117,72 ; movaps 0x48(%ebp),%xmm6
DB 15,20,212 ; unpcklps %xmm4,%xmm2
- DB 15,40,101,88 ; movaps 0x58(%ebp),%xmm4
- DB 141,90,8 ; lea 0x8(%edx),%ebx
- DB 15,41,100,36,80 ; movaps %xmm4,0x50(%esp)
- DB 15,41,116,36,64 ; movaps %xmm6,0x40(%esp)
- DB 15,41,108,36,48 ; movaps %xmm5,0x30(%esp)
- DB 15,41,124,36,32 ; movaps %xmm7,0x20(%esp)
- DB 137,124,36,16 ; mov %edi,0x10(%esp)
- DB 137,116,36,12 ; mov %esi,0xc(%esp)
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
- DB 255,82,4 ; call *0x4(%edx)
- DB 131,196,108 ; add $0x6c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 141,72,8 ; lea 0x8(%eax),%ecx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 81 ; push %ecx
+ DB 255,117,8 ; pushl 0x8(%ebp)
+ DB 255,80,4 ; call *0x4(%eax)
+ DB 131,196,24 ; add $0x18,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -41438,57 +40333,37 @@ PUBLIC _sk_table_a_sse2
_sk_table_a_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
- DB 139,85,12 ; mov 0xc(%ebp),%edx
- DB 139,50 ; mov (%edx),%esi
- DB 139,62 ; mov (%esi),%edi
- DB 139,118,4 ; mov 0x4(%esi),%esi
- DB 78 ; dec %esi
- DB 102,15,110,230 ; movd %esi,%xmm4
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 139,69,12 ; mov 0xc(%ebp),%eax
+ DB 139,8 ; mov (%eax),%ecx
+ DB 139,17 ; mov (%ecx),%edx
+ DB 139,73,4 ; mov 0x4(%ecx),%ecx
+ DB 73 ; dec %ecx
+ DB 102,15,110,225 ; movd %ecx,%xmm4
DB 102,15,112,228,0 ; pshufd $0x0,%xmm4,%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
DB 15,89,227 ; mulps %xmm3,%xmm4
DB 102,15,91,220 ; cvtps2dq %xmm4,%xmm3
DB 102,15,112,227,229 ; pshufd $0xe5,%xmm3,%xmm4
DB 102,15,112,235,231 ; pshufd $0xe7,%xmm3,%xmm5
- DB 102,15,126,238 ; movd %xmm5,%esi
- DB 243,15,16,44,183 ; movss (%edi,%esi,4),%xmm5
- DB 102,15,126,230 ; movd %xmm4,%esi
- DB 243,15,16,36,183 ; movss (%edi,%esi,4),%xmm4
- DB 102,15,126,222 ; movd %xmm3,%esi
+ DB 102,15,126,233 ; movd %xmm5,%ecx
+ DB 243,15,16,44,138 ; movss (%edx,%ecx,4),%xmm5
+ DB 102,15,126,225 ; movd %xmm4,%ecx
+ DB 243,15,16,36,138 ; movss (%edx,%ecx,4),%xmm4
+ DB 102,15,126,217 ; movd %xmm3,%ecx
DB 102,15,112,243,78 ; pshufd $0x4e,%xmm3,%xmm6
- DB 243,15,16,28,183 ; movss (%edi,%esi,4),%xmm3
- DB 102,15,126,246 ; movd %xmm6,%esi
- DB 243,15,16,52,183 ; movss (%edi,%esi,4),%xmm6
- DB 139,117,20 ; mov 0x14(%ebp),%esi
- DB 139,125,24 ; mov 0x18(%ebp),%edi
- DB 15,40,125,40 ; movaps 0x28(%ebp),%xmm7
+ DB 243,15,16,28,138 ; movss (%edx,%ecx,4),%xmm3
+ DB 102,15,126,241 ; movd %xmm6,%ecx
+ DB 243,15,16,52,138 ; movss (%edx,%ecx,4),%xmm6
DB 15,20,229 ; unpcklps %xmm5,%xmm4
- DB 15,40,109,56 ; movaps 0x38(%ebp),%xmm5
DB 15,20,222 ; unpcklps %xmm6,%xmm3
- DB 15,40,117,72 ; movaps 0x48(%ebp),%xmm6
DB 15,20,220 ; unpcklps %xmm4,%xmm3
- DB 15,40,101,88 ; movaps 0x58(%ebp),%xmm4
- DB 141,90,8 ; lea 0x8(%edx),%ebx
- DB 15,41,100,36,80 ; movaps %xmm4,0x50(%esp)
- DB 15,41,116,36,64 ; movaps %xmm6,0x40(%esp)
- DB 15,41,108,36,48 ; movaps %xmm5,0x30(%esp)
- DB 15,41,124,36,32 ; movaps %xmm7,0x20(%esp)
- DB 137,124,36,16 ; mov %edi,0x10(%esp)
- DB 137,116,36,12 ; mov %esi,0xc(%esp)
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
- DB 255,82,4 ; call *0x4(%edx)
- DB 131,196,108 ; add $0x6c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 141,72,8 ; lea 0x8(%eax),%ecx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 81 ; push %ecx
+ DB 255,117,8 ; pushl 0x8(%ebp)
+ DB 255,80,4 ; call *0x4(%eax)
+ DB 131,196,24 ; add $0x18,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -41496,96 +40371,84 @@ PUBLIC _sk_parametric_r_sse2
_sk_parametric_r_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 232,0,0,0,0 ; call 42d5 <_sk_parametric_r_sse2+0xe>
- DB 94 ; pop %esi
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
- DB 139,85,12 ; mov 0xc(%ebp),%edx
- DB 139,58 ; mov (%edx),%edi
- DB 243,15,16,47 ; movss (%edi),%xmm5
- DB 243,15,16,119,4 ; movss 0x4(%edi),%xmm6
- DB 15,198,246,0 ; shufps $0x0,%xmm6,%xmm6
- DB 243,15,16,103,8 ; movss 0x8(%edi),%xmm4
+ DB 131,236,24 ; sub $0x18,%esp
+ DB 15,41,93,232 ; movaps %xmm3,-0x18(%ebp)
+ DB 15,40,218 ; movaps %xmm2,%xmm3
+ DB 15,40,209 ; movaps %xmm1,%xmm2
+ DB 15,40,200 ; movaps %xmm0,%xmm1
+ DB 232,0,0,0,0 ; call 33ae <_sk_parametric_r_sse2+0x18>
+ DB 90 ; pop %edx
+ DB 139,69,12 ; mov 0xc(%ebp),%eax
+ DB 139,8 ; mov (%eax),%ecx
+ DB 243,15,16,105,16 ; movss 0x10(%ecx),%xmm5
+ DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
+ DB 243,15,16,97,12 ; movss 0xc(%ecx),%xmm4
DB 15,198,228,0 ; shufps $0x0,%xmm4,%xmm4
- DB 15,89,240 ; mulps %xmm0,%xmm6
- DB 15,88,244 ; addps %xmm4,%xmm6
+ DB 15,89,225 ; mulps %xmm1,%xmm4
+ DB 243,15,16,113,4 ; movss 0x4(%ecx),%xmm6
+ DB 15,198,246,0 ; shufps $0x0,%xmm6,%xmm6
+ DB 15,89,241 ; mulps %xmm1,%xmm6
+ DB 15,194,205,2 ; cmpleps %xmm5,%xmm1
+ DB 243,15,16,105,24 ; movss 0x18(%ecx),%xmm5
+ DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
+ DB 15,88,229 ; addps %xmm5,%xmm4
+ DB 243,15,16,105,8 ; movss 0x8(%ecx),%xmm5
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
- DB 15,91,230 ; cvtdq2ps %xmm6,%xmm4
- DB 15,89,166,187,84,0,0 ; mulps 0x54bb(%esi),%xmm4
- DB 15,84,182,203,84,0,0 ; andps 0x54cb(%esi),%xmm6
- DB 15,86,182,219,84,0,0 ; orps 0x54db(%esi),%xmm6
- DB 15,88,166,235,84,0,0 ; addps 0x54eb(%esi),%xmm4
- DB 15,40,190,251,84,0,0 ; movaps 0x54fb(%esi),%xmm7
+ DB 15,88,245 ; addps %xmm5,%xmm6
+ DB 15,91,238 ; cvtdq2ps %xmm6,%xmm5
+ DB 15,89,170,2,65,0,0 ; mulps 0x4102(%edx),%xmm5
+ DB 15,84,178,18,65,0,0 ; andps 0x4112(%edx),%xmm6
+ DB 15,86,178,34,65,0,0 ; orps 0x4122(%edx),%xmm6
+ DB 15,88,170,50,65,0,0 ; addps 0x4132(%edx),%xmm5
+ DB 15,40,186,66,65,0,0 ; movaps 0x4142(%edx),%xmm7
DB 15,89,254 ; mulps %xmm6,%xmm7
- DB 15,92,231 ; subps %xmm7,%xmm4
- DB 15,88,182,11,85,0,0 ; addps 0x550b(%esi),%xmm6
- DB 15,40,190,27,85,0,0 ; movaps 0x551b(%esi),%xmm7
- DB 15,94,254 ; divps %xmm6,%xmm7
- DB 15,92,231 ; subps %xmm7,%xmm4
- DB 15,89,229 ; mulps %xmm5,%xmm4
- DB 243,15,91,236 ; cvttps2dq %xmm4,%xmm5
- DB 15,91,245 ; cvtdq2ps %xmm5,%xmm6
- DB 15,40,252 ; movaps %xmm4,%xmm7
- DB 15,194,254,1 ; cmpltps %xmm6,%xmm7
- DB 15,40,174,43,85,0,0 ; movaps 0x552b(%esi),%xmm5
- DB 15,84,253 ; andps %xmm5,%xmm7
- DB 15,92,247 ; subps %xmm7,%xmm6
- DB 15,40,252 ; movaps %xmm4,%xmm7
- DB 15,92,254 ; subps %xmm6,%xmm7
- DB 15,88,166,59,85,0,0 ; addps 0x553b(%esi),%xmm4
- DB 15,40,182,75,85,0,0 ; movaps 0x554b(%esi),%xmm6
- DB 15,89,247 ; mulps %xmm7,%xmm6
- DB 15,92,230 ; subps %xmm6,%xmm4
- DB 15,40,182,91,85,0,0 ; movaps 0x555b(%esi),%xmm6
- DB 15,92,247 ; subps %xmm7,%xmm6
- DB 15,40,190,107,85,0,0 ; movaps 0x556b(%esi),%xmm7
+ DB 15,92,239 ; subps %xmm7,%xmm5
+ DB 15,88,178,82,65,0,0 ; addps 0x4152(%edx),%xmm6
+ DB 15,40,186,98,65,0,0 ; movaps 0x4162(%edx),%xmm7
DB 15,94,254 ; divps %xmm6,%xmm7
- DB 15,88,252 ; addps %xmm4,%xmm7
- DB 15,89,190,123,85,0,0 ; mulps 0x557b(%esi),%xmm7
- DB 139,117,20 ; mov 0x14(%ebp),%esi
- DB 243,15,16,103,16 ; movss 0x10(%edi),%xmm4
- DB 15,198,228,0 ; shufps $0x0,%xmm4,%xmm4
- DB 243,15,16,119,12 ; movss 0xc(%edi),%xmm6
+ DB 243,15,16,49 ; movss (%ecx),%xmm6
DB 15,198,246,0 ; shufps $0x0,%xmm6,%xmm6
- DB 15,89,240 ; mulps %xmm0,%xmm6
- DB 15,194,196,2 ; cmpleps %xmm4,%xmm0
- DB 243,15,16,103,24 ; movss 0x18(%edi),%xmm4
- DB 15,198,228,0 ; shufps $0x0,%xmm4,%xmm4
- DB 15,88,244 ; addps %xmm4,%xmm6
- DB 243,15,16,103,20 ; movss 0x14(%edi),%xmm4
- DB 139,125,24 ; mov 0x18(%ebp),%edi
- DB 102,15,91,255 ; cvtps2dq %xmm7,%xmm7
- DB 15,198,228,0 ; shufps $0x0,%xmm4,%xmm4
- DB 15,88,231 ; addps %xmm7,%xmm4
- DB 15,40,125,40 ; movaps 0x28(%ebp),%xmm7
- DB 15,84,240 ; andps %xmm0,%xmm6
- DB 15,85,196 ; andnps %xmm4,%xmm0
- DB 15,40,101,56 ; movaps 0x38(%ebp),%xmm4
- DB 15,86,198 ; orps %xmm6,%xmm0
- DB 15,87,246 ; xorps %xmm6,%xmm6
- DB 15,95,198 ; maxps %xmm6,%xmm0
- DB 15,40,117,72 ; movaps 0x48(%ebp),%xmm6
- DB 15,93,197 ; minps %xmm5,%xmm0
- DB 15,40,109,88 ; movaps 0x58(%ebp),%xmm5
- DB 141,90,8 ; lea 0x8(%edx),%ebx
- DB 15,41,108,36,80 ; movaps %xmm5,0x50(%esp)
- DB 15,41,116,36,64 ; movaps %xmm6,0x40(%esp)
- DB 15,41,100,36,48 ; movaps %xmm4,0x30(%esp)
- DB 15,41,124,36,32 ; movaps %xmm7,0x20(%esp)
- DB 137,124,36,16 ; mov %edi,0x10(%esp)
- DB 137,116,36,12 ; mov %esi,0xc(%esp)
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
- DB 255,82,4 ; call *0x4(%edx)
- DB 131,196,108 ; add $0x6c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 15,92,239 ; subps %xmm7,%xmm5
+ DB 15,89,238 ; mulps %xmm6,%xmm5
+ DB 243,15,91,245 ; cvttps2dq %xmm5,%xmm6
+ DB 15,91,254 ; cvtdq2ps %xmm6,%xmm7
+ DB 15,40,197 ; movaps %xmm5,%xmm0
+ DB 15,194,199,1 ; cmpltps %xmm7,%xmm0
+ DB 15,40,178,114,65,0,0 ; movaps 0x4172(%edx),%xmm6
+ DB 15,84,198 ; andps %xmm6,%xmm0
+ DB 15,92,248 ; subps %xmm0,%xmm7
+ DB 15,40,197 ; movaps %xmm5,%xmm0
+ DB 15,92,199 ; subps %xmm7,%xmm0
+ DB 15,88,170,130,65,0,0 ; addps 0x4182(%edx),%xmm5
+ DB 15,40,186,146,65,0,0 ; movaps 0x4192(%edx),%xmm7
+ DB 15,89,248 ; mulps %xmm0,%xmm7
+ DB 15,92,239 ; subps %xmm7,%xmm5
+ DB 15,40,186,162,65,0,0 ; movaps 0x41a2(%edx),%xmm7
+ DB 15,92,248 ; subps %xmm0,%xmm7
+ DB 15,40,130,178,65,0,0 ; movaps 0x41b2(%edx),%xmm0
+ DB 15,94,199 ; divps %xmm7,%xmm0
+ DB 15,88,197 ; addps %xmm5,%xmm0
+ DB 15,89,130,194,65,0,0 ; mulps 0x41c2(%edx),%xmm0
+ DB 102,15,91,192 ; cvtps2dq %xmm0,%xmm0
+ DB 243,15,16,105,20 ; movss 0x14(%ecx),%xmm5
+ DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
+ DB 15,88,232 ; addps %xmm0,%xmm5
+ DB 15,84,225 ; andps %xmm1,%xmm4
+ DB 15,85,205 ; andnps %xmm5,%xmm1
+ DB 15,86,204 ; orps %xmm4,%xmm1
+ DB 15,87,192 ; xorps %xmm0,%xmm0
+ DB 15,95,200 ; maxps %xmm0,%xmm1
+ DB 15,93,206 ; minps %xmm6,%xmm1
+ DB 141,72,8 ; lea 0x8(%eax),%ecx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 15,40,193 ; movaps %xmm1,%xmm0
+ DB 15,40,202 ; movaps %xmm2,%xmm1
+ DB 15,40,211 ; movaps %xmm3,%xmm2
+ DB 15,40,93,232 ; movaps -0x18(%ebp),%xmm3
+ DB 81 ; push %ecx
+ DB 255,117,8 ; pushl 0x8(%ebp)
+ DB 255,80,4 ; call *0x4(%eax)
+ DB 131,196,40 ; add $0x28,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -41593,96 +40456,82 @@ PUBLIC _sk_parametric_g_sse2
_sk_parametric_g_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 232,0,0,0,0 ; call 4437 <_sk_parametric_g_sse2+0xe>
- DB 94 ; pop %esi
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
- DB 139,85,12 ; mov 0xc(%ebp),%edx
- DB 139,58 ; mov (%edx),%edi
- DB 243,15,16,47 ; movss (%edi),%xmm5
- DB 243,15,16,119,4 ; movss 0x4(%edi),%xmm6
- DB 15,198,246,0 ; shufps $0x0,%xmm6,%xmm6
- DB 243,15,16,103,8 ; movss 0x8(%edi),%xmm4
+ DB 131,236,24 ; sub $0x18,%esp
+ DB 15,41,93,232 ; movaps %xmm3,-0x18(%ebp)
+ DB 15,40,218 ; movaps %xmm2,%xmm3
+ DB 15,40,208 ; movaps %xmm0,%xmm2
+ DB 232,0,0,0,0 ; call 34e5 <_sk_parametric_g_sse2+0x15>
+ DB 90 ; pop %edx
+ DB 139,69,12 ; mov 0xc(%ebp),%eax
+ DB 139,8 ; mov (%eax),%ecx
+ DB 243,15,16,105,16 ; movss 0x10(%ecx),%xmm5
+ DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
+ DB 243,15,16,97,12 ; movss 0xc(%ecx),%xmm4
DB 15,198,228,0 ; shufps $0x0,%xmm4,%xmm4
+ DB 15,89,225 ; mulps %xmm1,%xmm4
+ DB 243,15,16,113,4 ; movss 0x4(%ecx),%xmm6
+ DB 15,198,246,0 ; shufps $0x0,%xmm6,%xmm6
DB 15,89,241 ; mulps %xmm1,%xmm6
- DB 15,88,244 ; addps %xmm4,%xmm6
+ DB 15,194,205,2 ; cmpleps %xmm5,%xmm1
+ DB 243,15,16,105,24 ; movss 0x18(%ecx),%xmm5
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
- DB 15,91,230 ; cvtdq2ps %xmm6,%xmm4
- DB 15,89,166,41,84,0,0 ; mulps 0x5429(%esi),%xmm4
- DB 15,84,182,57,84,0,0 ; andps 0x5439(%esi),%xmm6
- DB 15,86,182,73,84,0,0 ; orps 0x5449(%esi),%xmm6
- DB 15,88,166,89,84,0,0 ; addps 0x5459(%esi),%xmm4
- DB 15,40,190,105,84,0,0 ; movaps 0x5469(%esi),%xmm7
+ DB 15,88,229 ; addps %xmm5,%xmm4
+ DB 243,15,16,105,8 ; movss 0x8(%ecx),%xmm5
+ DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
+ DB 15,88,245 ; addps %xmm5,%xmm6
+ DB 15,91,238 ; cvtdq2ps %xmm6,%xmm5
+ DB 15,89,170,155,64,0,0 ; mulps 0x409b(%edx),%xmm5
+ DB 15,84,178,171,64,0,0 ; andps 0x40ab(%edx),%xmm6
+ DB 15,86,178,187,64,0,0 ; orps 0x40bb(%edx),%xmm6
+ DB 15,88,170,203,64,0,0 ; addps 0x40cb(%edx),%xmm5
+ DB 15,40,186,219,64,0,0 ; movaps 0x40db(%edx),%xmm7
DB 15,89,254 ; mulps %xmm6,%xmm7
- DB 15,92,231 ; subps %xmm7,%xmm4
- DB 15,88,182,121,84,0,0 ; addps 0x5479(%esi),%xmm6
- DB 15,40,190,137,84,0,0 ; movaps 0x5489(%esi),%xmm7
- DB 15,94,254 ; divps %xmm6,%xmm7
- DB 15,92,231 ; subps %xmm7,%xmm4
- DB 15,89,229 ; mulps %xmm5,%xmm4
- DB 243,15,91,236 ; cvttps2dq %xmm4,%xmm5
- DB 15,91,245 ; cvtdq2ps %xmm5,%xmm6
- DB 15,40,252 ; movaps %xmm4,%xmm7
- DB 15,194,254,1 ; cmpltps %xmm6,%xmm7
- DB 15,40,174,153,84,0,0 ; movaps 0x5499(%esi),%xmm5
- DB 15,84,253 ; andps %xmm5,%xmm7
- DB 15,92,247 ; subps %xmm7,%xmm6
- DB 15,40,252 ; movaps %xmm4,%xmm7
- DB 15,92,254 ; subps %xmm6,%xmm7
- DB 15,88,166,169,84,0,0 ; addps 0x54a9(%esi),%xmm4
- DB 15,40,182,185,84,0,0 ; movaps 0x54b9(%esi),%xmm6
- DB 15,89,247 ; mulps %xmm7,%xmm6
- DB 15,92,230 ; subps %xmm6,%xmm4
- DB 15,40,182,201,84,0,0 ; movaps 0x54c9(%esi),%xmm6
- DB 15,92,247 ; subps %xmm7,%xmm6
- DB 15,40,190,217,84,0,0 ; movaps 0x54d9(%esi),%xmm7
+ DB 15,92,239 ; subps %xmm7,%xmm5
+ DB 15,88,178,235,64,0,0 ; addps 0x40eb(%edx),%xmm6
+ DB 15,40,186,251,64,0,0 ; movaps 0x40fb(%edx),%xmm7
DB 15,94,254 ; divps %xmm6,%xmm7
- DB 15,88,252 ; addps %xmm4,%xmm7
- DB 15,89,190,233,84,0,0 ; mulps 0x54e9(%esi),%xmm7
- DB 139,117,20 ; mov 0x14(%ebp),%esi
- DB 243,15,16,103,16 ; movss 0x10(%edi),%xmm4
- DB 15,198,228,0 ; shufps $0x0,%xmm4,%xmm4
- DB 243,15,16,119,12 ; movss 0xc(%edi),%xmm6
+ DB 243,15,16,49 ; movss (%ecx),%xmm6
DB 15,198,246,0 ; shufps $0x0,%xmm6,%xmm6
- DB 15,89,241 ; mulps %xmm1,%xmm6
- DB 15,194,204,2 ; cmpleps %xmm4,%xmm1
- DB 243,15,16,103,24 ; movss 0x18(%edi),%xmm4
- DB 15,198,228,0 ; shufps $0x0,%xmm4,%xmm4
- DB 15,88,244 ; addps %xmm4,%xmm6
- DB 243,15,16,103,20 ; movss 0x14(%edi),%xmm4
- DB 139,125,24 ; mov 0x18(%ebp),%edi
- DB 102,15,91,255 ; cvtps2dq %xmm7,%xmm7
- DB 15,198,228,0 ; shufps $0x0,%xmm4,%xmm4
- DB 15,88,231 ; addps %xmm7,%xmm4
- DB 15,40,125,40 ; movaps 0x28(%ebp),%xmm7
- DB 15,84,241 ; andps %xmm1,%xmm6
- DB 15,85,204 ; andnps %xmm4,%xmm1
- DB 15,40,101,56 ; movaps 0x38(%ebp),%xmm4
- DB 15,86,206 ; orps %xmm6,%xmm1
- DB 15,87,246 ; xorps %xmm6,%xmm6
- DB 15,95,206 ; maxps %xmm6,%xmm1
- DB 15,40,117,72 ; movaps 0x48(%ebp),%xmm6
- DB 15,93,205 ; minps %xmm5,%xmm1
- DB 15,40,109,88 ; movaps 0x58(%ebp),%xmm5
- DB 141,90,8 ; lea 0x8(%edx),%ebx
- DB 15,41,108,36,80 ; movaps %xmm5,0x50(%esp)
- DB 15,41,116,36,64 ; movaps %xmm6,0x40(%esp)
- DB 15,41,100,36,48 ; movaps %xmm4,0x30(%esp)
- DB 15,41,124,36,32 ; movaps %xmm7,0x20(%esp)
- DB 137,124,36,16 ; mov %edi,0x10(%esp)
- DB 137,116,36,12 ; mov %esi,0xc(%esp)
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
- DB 255,82,4 ; call *0x4(%edx)
- DB 131,196,108 ; add $0x6c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 15,92,239 ; subps %xmm7,%xmm5
+ DB 15,89,238 ; mulps %xmm6,%xmm5
+ DB 243,15,91,245 ; cvttps2dq %xmm5,%xmm6
+ DB 15,91,254 ; cvtdq2ps %xmm6,%xmm7
+ DB 15,40,197 ; movaps %xmm5,%xmm0
+ DB 15,194,199,1 ; cmpltps %xmm7,%xmm0
+ DB 15,40,178,11,65,0,0 ; movaps 0x410b(%edx),%xmm6
+ DB 15,84,198 ; andps %xmm6,%xmm0
+ DB 15,92,248 ; subps %xmm0,%xmm7
+ DB 15,40,197 ; movaps %xmm5,%xmm0
+ DB 15,92,199 ; subps %xmm7,%xmm0
+ DB 15,88,170,27,65,0,0 ; addps 0x411b(%edx),%xmm5
+ DB 15,40,186,43,65,0,0 ; movaps 0x412b(%edx),%xmm7
+ DB 15,89,248 ; mulps %xmm0,%xmm7
+ DB 15,92,239 ; subps %xmm7,%xmm5
+ DB 15,40,186,59,65,0,0 ; movaps 0x413b(%edx),%xmm7
+ DB 15,92,248 ; subps %xmm0,%xmm7
+ DB 15,40,130,75,65,0,0 ; movaps 0x414b(%edx),%xmm0
+ DB 15,94,199 ; divps %xmm7,%xmm0
+ DB 15,88,197 ; addps %xmm5,%xmm0
+ DB 15,89,130,91,65,0,0 ; mulps 0x415b(%edx),%xmm0
+ DB 102,15,91,192 ; cvtps2dq %xmm0,%xmm0
+ DB 243,15,16,105,20 ; movss 0x14(%ecx),%xmm5
+ DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
+ DB 15,88,232 ; addps %xmm0,%xmm5
+ DB 15,84,225 ; andps %xmm1,%xmm4
+ DB 15,85,205 ; andnps %xmm5,%xmm1
+ DB 15,86,204 ; orps %xmm4,%xmm1
+ DB 15,87,192 ; xorps %xmm0,%xmm0
+ DB 15,95,200 ; maxps %xmm0,%xmm1
+ DB 15,93,206 ; minps %xmm6,%xmm1
+ DB 141,72,8 ; lea 0x8(%eax),%ecx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 15,40,194 ; movaps %xmm2,%xmm0
+ DB 15,40,211 ; movaps %xmm3,%xmm2
+ DB 15,40,93,232 ; movaps -0x18(%ebp),%xmm3
+ DB 81 ; push %ecx
+ DB 255,117,8 ; pushl 0x8(%ebp)
+ DB 255,80,4 ; call *0x4(%eax)
+ DB 131,196,40 ; add $0x28,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -41690,96 +40539,82 @@ PUBLIC _sk_parametric_b_sse2
_sk_parametric_b_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 232,0,0,0,0 ; call 4599 <_sk_parametric_b_sse2+0xe>
- DB 94 ; pop %esi
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
- DB 139,85,12 ; mov 0xc(%ebp),%edx
- DB 139,58 ; mov (%edx),%edi
- DB 243,15,16,47 ; movss (%edi),%xmm5
- DB 243,15,16,119,4 ; movss 0x4(%edi),%xmm6
- DB 15,198,246,0 ; shufps $0x0,%xmm6,%xmm6
- DB 243,15,16,103,8 ; movss 0x8(%edi),%xmm4
+ DB 131,236,24 ; sub $0x18,%esp
+ DB 15,41,93,232 ; movaps %xmm3,-0x18(%ebp)
+ DB 15,40,217 ; movaps %xmm1,%xmm3
+ DB 15,40,200 ; movaps %xmm0,%xmm1
+ DB 232,0,0,0,0 ; call 3619 <_sk_parametric_b_sse2+0x15>
+ DB 90 ; pop %edx
+ DB 139,69,12 ; mov 0xc(%ebp),%eax
+ DB 139,8 ; mov (%eax),%ecx
+ DB 243,15,16,105,16 ; movss 0x10(%ecx),%xmm5
+ DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
+ DB 243,15,16,97,12 ; movss 0xc(%ecx),%xmm4
DB 15,198,228,0 ; shufps $0x0,%xmm4,%xmm4
+ DB 15,89,226 ; mulps %xmm2,%xmm4
+ DB 243,15,16,113,4 ; movss 0x4(%ecx),%xmm6
+ DB 15,198,246,0 ; shufps $0x0,%xmm6,%xmm6
DB 15,89,242 ; mulps %xmm2,%xmm6
- DB 15,88,244 ; addps %xmm4,%xmm6
+ DB 15,194,213,2 ; cmpleps %xmm5,%xmm2
+ DB 243,15,16,105,24 ; movss 0x18(%ecx),%xmm5
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
- DB 15,91,230 ; cvtdq2ps %xmm6,%xmm4
- DB 15,89,166,151,83,0,0 ; mulps 0x5397(%esi),%xmm4
- DB 15,84,182,167,83,0,0 ; andps 0x53a7(%esi),%xmm6
- DB 15,86,182,183,83,0,0 ; orps 0x53b7(%esi),%xmm6
- DB 15,88,166,199,83,0,0 ; addps 0x53c7(%esi),%xmm4
- DB 15,40,190,215,83,0,0 ; movaps 0x53d7(%esi),%xmm7
+ DB 15,88,229 ; addps %xmm5,%xmm4
+ DB 243,15,16,105,8 ; movss 0x8(%ecx),%xmm5
+ DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
+ DB 15,88,245 ; addps %xmm5,%xmm6
+ DB 15,91,238 ; cvtdq2ps %xmm6,%xmm5
+ DB 15,89,170,55,64,0,0 ; mulps 0x4037(%edx),%xmm5
+ DB 15,84,178,71,64,0,0 ; andps 0x4047(%edx),%xmm6
+ DB 15,86,178,87,64,0,0 ; orps 0x4057(%edx),%xmm6
+ DB 15,88,170,103,64,0,0 ; addps 0x4067(%edx),%xmm5
+ DB 15,40,186,119,64,0,0 ; movaps 0x4077(%edx),%xmm7
DB 15,89,254 ; mulps %xmm6,%xmm7
- DB 15,92,231 ; subps %xmm7,%xmm4
- DB 15,88,182,231,83,0,0 ; addps 0x53e7(%esi),%xmm6
- DB 15,40,190,247,83,0,0 ; movaps 0x53f7(%esi),%xmm7
- DB 15,94,254 ; divps %xmm6,%xmm7
- DB 15,92,231 ; subps %xmm7,%xmm4
- DB 15,89,229 ; mulps %xmm5,%xmm4
- DB 243,15,91,236 ; cvttps2dq %xmm4,%xmm5
- DB 15,91,245 ; cvtdq2ps %xmm5,%xmm6
- DB 15,40,252 ; movaps %xmm4,%xmm7
- DB 15,194,254,1 ; cmpltps %xmm6,%xmm7
- DB 15,40,174,7,84,0,0 ; movaps 0x5407(%esi),%xmm5
- DB 15,84,253 ; andps %xmm5,%xmm7
- DB 15,92,247 ; subps %xmm7,%xmm6
- DB 15,40,252 ; movaps %xmm4,%xmm7
- DB 15,92,254 ; subps %xmm6,%xmm7
- DB 15,88,166,23,84,0,0 ; addps 0x5417(%esi),%xmm4
- DB 15,40,182,39,84,0,0 ; movaps 0x5427(%esi),%xmm6
- DB 15,89,247 ; mulps %xmm7,%xmm6
- DB 15,92,230 ; subps %xmm6,%xmm4
- DB 15,40,182,55,84,0,0 ; movaps 0x5437(%esi),%xmm6
- DB 15,92,247 ; subps %xmm7,%xmm6
- DB 15,40,190,71,84,0,0 ; movaps 0x5447(%esi),%xmm7
+ DB 15,92,239 ; subps %xmm7,%xmm5
+ DB 15,88,178,135,64,0,0 ; addps 0x4087(%edx),%xmm6
+ DB 15,40,186,151,64,0,0 ; movaps 0x4097(%edx),%xmm7
DB 15,94,254 ; divps %xmm6,%xmm7
- DB 15,88,252 ; addps %xmm4,%xmm7
- DB 15,89,190,87,84,0,0 ; mulps 0x5457(%esi),%xmm7
- DB 139,117,20 ; mov 0x14(%ebp),%esi
- DB 243,15,16,103,16 ; movss 0x10(%edi),%xmm4
- DB 15,198,228,0 ; shufps $0x0,%xmm4,%xmm4
- DB 243,15,16,119,12 ; movss 0xc(%edi),%xmm6
+ DB 243,15,16,49 ; movss (%ecx),%xmm6
DB 15,198,246,0 ; shufps $0x0,%xmm6,%xmm6
- DB 15,89,242 ; mulps %xmm2,%xmm6
- DB 15,194,212,2 ; cmpleps %xmm4,%xmm2
- DB 243,15,16,103,24 ; movss 0x18(%edi),%xmm4
- DB 15,198,228,0 ; shufps $0x0,%xmm4,%xmm4
- DB 15,88,244 ; addps %xmm4,%xmm6
- DB 243,15,16,103,20 ; movss 0x14(%edi),%xmm4
- DB 139,125,24 ; mov 0x18(%ebp),%edi
- DB 102,15,91,255 ; cvtps2dq %xmm7,%xmm7
- DB 15,198,228,0 ; shufps $0x0,%xmm4,%xmm4
- DB 15,88,231 ; addps %xmm7,%xmm4
- DB 15,40,125,40 ; movaps 0x28(%ebp),%xmm7
- DB 15,84,242 ; andps %xmm2,%xmm6
- DB 15,85,212 ; andnps %xmm4,%xmm2
- DB 15,40,101,56 ; movaps 0x38(%ebp),%xmm4
- DB 15,86,214 ; orps %xmm6,%xmm2
- DB 15,87,246 ; xorps %xmm6,%xmm6
- DB 15,95,214 ; maxps %xmm6,%xmm2
- DB 15,40,117,72 ; movaps 0x48(%ebp),%xmm6
- DB 15,93,213 ; minps %xmm5,%xmm2
- DB 15,40,109,88 ; movaps 0x58(%ebp),%xmm5
- DB 141,90,8 ; lea 0x8(%edx),%ebx
- DB 15,41,108,36,80 ; movaps %xmm5,0x50(%esp)
- DB 15,41,116,36,64 ; movaps %xmm6,0x40(%esp)
- DB 15,41,100,36,48 ; movaps %xmm4,0x30(%esp)
- DB 15,41,124,36,32 ; movaps %xmm7,0x20(%esp)
- DB 137,124,36,16 ; mov %edi,0x10(%esp)
- DB 137,116,36,12 ; mov %esi,0xc(%esp)
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
- DB 255,82,4 ; call *0x4(%edx)
- DB 131,196,108 ; add $0x6c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 15,92,239 ; subps %xmm7,%xmm5
+ DB 15,89,238 ; mulps %xmm6,%xmm5
+ DB 243,15,91,245 ; cvttps2dq %xmm5,%xmm6
+ DB 15,91,254 ; cvtdq2ps %xmm6,%xmm7
+ DB 15,40,197 ; movaps %xmm5,%xmm0
+ DB 15,194,199,1 ; cmpltps %xmm7,%xmm0
+ DB 15,40,178,167,64,0,0 ; movaps 0x40a7(%edx),%xmm6
+ DB 15,84,198 ; andps %xmm6,%xmm0
+ DB 15,92,248 ; subps %xmm0,%xmm7
+ DB 15,40,197 ; movaps %xmm5,%xmm0
+ DB 15,92,199 ; subps %xmm7,%xmm0
+ DB 15,88,170,183,64,0,0 ; addps 0x40b7(%edx),%xmm5
+ DB 15,40,186,199,64,0,0 ; movaps 0x40c7(%edx),%xmm7
+ DB 15,89,248 ; mulps %xmm0,%xmm7
+ DB 15,92,239 ; subps %xmm7,%xmm5
+ DB 15,40,186,215,64,0,0 ; movaps 0x40d7(%edx),%xmm7
+ DB 15,92,248 ; subps %xmm0,%xmm7
+ DB 15,40,130,231,64,0,0 ; movaps 0x40e7(%edx),%xmm0
+ DB 15,94,199 ; divps %xmm7,%xmm0
+ DB 15,88,197 ; addps %xmm5,%xmm0
+ DB 15,89,130,247,64,0,0 ; mulps 0x40f7(%edx),%xmm0
+ DB 102,15,91,192 ; cvtps2dq %xmm0,%xmm0
+ DB 243,15,16,105,20 ; movss 0x14(%ecx),%xmm5
+ DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
+ DB 15,88,232 ; addps %xmm0,%xmm5
+ DB 15,84,226 ; andps %xmm2,%xmm4
+ DB 15,85,213 ; andnps %xmm5,%xmm2
+ DB 15,86,212 ; orps %xmm4,%xmm2
+ DB 15,87,192 ; xorps %xmm0,%xmm0
+ DB 15,95,208 ; maxps %xmm0,%xmm2
+ DB 15,93,214 ; minps %xmm6,%xmm2
+ DB 141,72,8 ; lea 0x8(%eax),%ecx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 15,40,193 ; movaps %xmm1,%xmm0
+ DB 15,40,203 ; movaps %xmm3,%xmm1
+ DB 15,40,93,232 ; movaps -0x18(%ebp),%xmm3
+ DB 81 ; push %ecx
+ DB 255,117,8 ; pushl 0x8(%ebp)
+ DB 255,80,4 ; call *0x4(%eax)
+ DB 131,196,40 ; add $0x28,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -41787,96 +40622,82 @@ PUBLIC _sk_parametric_a_sse2
_sk_parametric_a_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 232,0,0,0,0 ; call 46fb <_sk_parametric_a_sse2+0xe>
- DB 94 ; pop %esi
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
- DB 139,85,12 ; mov 0xc(%ebp),%edx
- DB 139,58 ; mov (%edx),%edi
- DB 243,15,16,47 ; movss (%edi),%xmm5
- DB 243,15,16,119,4 ; movss 0x4(%edi),%xmm6
- DB 15,198,246,0 ; shufps $0x0,%xmm6,%xmm6
- DB 243,15,16,103,8 ; movss 0x8(%edi),%xmm4
+ DB 131,236,24 ; sub $0x18,%esp
+ DB 15,41,85,232 ; movaps %xmm2,-0x18(%ebp)
+ DB 15,40,209 ; movaps %xmm1,%xmm2
+ DB 15,40,200 ; movaps %xmm0,%xmm1
+ DB 232,0,0,0,0 ; call 374d <_sk_parametric_a_sse2+0x15>
+ DB 90 ; pop %edx
+ DB 139,69,12 ; mov 0xc(%ebp),%eax
+ DB 139,8 ; mov (%eax),%ecx
+ DB 243,15,16,105,16 ; movss 0x10(%ecx),%xmm5
+ DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
+ DB 243,15,16,97,12 ; movss 0xc(%ecx),%xmm4
DB 15,198,228,0 ; shufps $0x0,%xmm4,%xmm4
+ DB 15,89,227 ; mulps %xmm3,%xmm4
+ DB 243,15,16,113,4 ; movss 0x4(%ecx),%xmm6
+ DB 15,198,246,0 ; shufps $0x0,%xmm6,%xmm6
DB 15,89,243 ; mulps %xmm3,%xmm6
- DB 15,88,244 ; addps %xmm4,%xmm6
+ DB 15,194,221,2 ; cmpleps %xmm5,%xmm3
+ DB 243,15,16,105,24 ; movss 0x18(%ecx),%xmm5
+ DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
+ DB 15,88,229 ; addps %xmm5,%xmm4
+ DB 243,15,16,105,8 ; movss 0x8(%ecx),%xmm5
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
- DB 15,91,230 ; cvtdq2ps %xmm6,%xmm4
- DB 15,89,166,5,83,0,0 ; mulps 0x5305(%esi),%xmm4
- DB 15,84,182,21,83,0,0 ; andps 0x5315(%esi),%xmm6
- DB 15,86,182,37,83,0,0 ; orps 0x5325(%esi),%xmm6
- DB 15,88,166,53,83,0,0 ; addps 0x5335(%esi),%xmm4
- DB 15,40,190,69,83,0,0 ; movaps 0x5345(%esi),%xmm7
+ DB 15,88,245 ; addps %xmm5,%xmm6
+ DB 15,91,238 ; cvtdq2ps %xmm6,%xmm5
+ DB 15,89,170,211,63,0,0 ; mulps 0x3fd3(%edx),%xmm5
+ DB 15,84,178,227,63,0,0 ; andps 0x3fe3(%edx),%xmm6
+ DB 15,86,178,243,63,0,0 ; orps 0x3ff3(%edx),%xmm6
+ DB 15,88,170,3,64,0,0 ; addps 0x4003(%edx),%xmm5
+ DB 15,40,186,19,64,0,0 ; movaps 0x4013(%edx),%xmm7
DB 15,89,254 ; mulps %xmm6,%xmm7
- DB 15,92,231 ; subps %xmm7,%xmm4
- DB 15,88,182,85,83,0,0 ; addps 0x5355(%esi),%xmm6
- DB 15,40,190,101,83,0,0 ; movaps 0x5365(%esi),%xmm7
- DB 15,94,254 ; divps %xmm6,%xmm7
- DB 15,92,231 ; subps %xmm7,%xmm4
- DB 15,89,229 ; mulps %xmm5,%xmm4
- DB 243,15,91,236 ; cvttps2dq %xmm4,%xmm5
- DB 15,91,245 ; cvtdq2ps %xmm5,%xmm6
- DB 15,40,252 ; movaps %xmm4,%xmm7
- DB 15,194,254,1 ; cmpltps %xmm6,%xmm7
- DB 15,40,174,117,83,0,0 ; movaps 0x5375(%esi),%xmm5
- DB 15,84,253 ; andps %xmm5,%xmm7
- DB 15,92,247 ; subps %xmm7,%xmm6
- DB 15,40,252 ; movaps %xmm4,%xmm7
- DB 15,92,254 ; subps %xmm6,%xmm7
- DB 15,88,166,133,83,0,0 ; addps 0x5385(%esi),%xmm4
- DB 15,40,182,149,83,0,0 ; movaps 0x5395(%esi),%xmm6
- DB 15,89,247 ; mulps %xmm7,%xmm6
- DB 15,92,230 ; subps %xmm6,%xmm4
- DB 15,40,182,165,83,0,0 ; movaps 0x53a5(%esi),%xmm6
- DB 15,92,247 ; subps %xmm7,%xmm6
- DB 15,40,190,181,83,0,0 ; movaps 0x53b5(%esi),%xmm7
+ DB 15,92,239 ; subps %xmm7,%xmm5
+ DB 15,88,178,35,64,0,0 ; addps 0x4023(%edx),%xmm6
+ DB 15,40,186,51,64,0,0 ; movaps 0x4033(%edx),%xmm7
DB 15,94,254 ; divps %xmm6,%xmm7
- DB 15,88,252 ; addps %xmm4,%xmm7
- DB 15,89,190,197,83,0,0 ; mulps 0x53c5(%esi),%xmm7
- DB 139,117,20 ; mov 0x14(%ebp),%esi
- DB 243,15,16,103,16 ; movss 0x10(%edi),%xmm4
- DB 15,198,228,0 ; shufps $0x0,%xmm4,%xmm4
- DB 243,15,16,119,12 ; movss 0xc(%edi),%xmm6
+ DB 243,15,16,49 ; movss (%ecx),%xmm6
DB 15,198,246,0 ; shufps $0x0,%xmm6,%xmm6
- DB 15,89,243 ; mulps %xmm3,%xmm6
- DB 15,194,220,2 ; cmpleps %xmm4,%xmm3
- DB 243,15,16,103,24 ; movss 0x18(%edi),%xmm4
- DB 15,198,228,0 ; shufps $0x0,%xmm4,%xmm4
- DB 15,88,244 ; addps %xmm4,%xmm6
- DB 243,15,16,103,20 ; movss 0x14(%edi),%xmm4
- DB 139,125,24 ; mov 0x18(%ebp),%edi
- DB 102,15,91,255 ; cvtps2dq %xmm7,%xmm7
- DB 15,198,228,0 ; shufps $0x0,%xmm4,%xmm4
- DB 15,88,231 ; addps %xmm7,%xmm4
- DB 15,40,125,40 ; movaps 0x28(%ebp),%xmm7
- DB 15,84,243 ; andps %xmm3,%xmm6
- DB 15,85,220 ; andnps %xmm4,%xmm3
- DB 15,40,101,56 ; movaps 0x38(%ebp),%xmm4
- DB 15,86,222 ; orps %xmm6,%xmm3
- DB 15,87,246 ; xorps %xmm6,%xmm6
- DB 15,95,222 ; maxps %xmm6,%xmm3
- DB 15,40,117,72 ; movaps 0x48(%ebp),%xmm6
- DB 15,93,221 ; minps %xmm5,%xmm3
- DB 15,40,109,88 ; movaps 0x58(%ebp),%xmm5
- DB 141,90,8 ; lea 0x8(%edx),%ebx
- DB 15,41,108,36,80 ; movaps %xmm5,0x50(%esp)
- DB 15,41,116,36,64 ; movaps %xmm6,0x40(%esp)
- DB 15,41,100,36,48 ; movaps %xmm4,0x30(%esp)
- DB 15,41,124,36,32 ; movaps %xmm7,0x20(%esp)
- DB 137,124,36,16 ; mov %edi,0x10(%esp)
- DB 137,116,36,12 ; mov %esi,0xc(%esp)
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
- DB 255,82,4 ; call *0x4(%edx)
- DB 131,196,108 ; add $0x6c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 15,92,239 ; subps %xmm7,%xmm5
+ DB 15,89,238 ; mulps %xmm6,%xmm5
+ DB 243,15,91,245 ; cvttps2dq %xmm5,%xmm6
+ DB 15,91,254 ; cvtdq2ps %xmm6,%xmm7
+ DB 15,40,197 ; movaps %xmm5,%xmm0
+ DB 15,194,199,1 ; cmpltps %xmm7,%xmm0
+ DB 15,40,178,67,64,0,0 ; movaps 0x4043(%edx),%xmm6
+ DB 15,84,198 ; andps %xmm6,%xmm0
+ DB 15,92,248 ; subps %xmm0,%xmm7
+ DB 15,40,197 ; movaps %xmm5,%xmm0
+ DB 15,92,199 ; subps %xmm7,%xmm0
+ DB 15,88,170,83,64,0,0 ; addps 0x4053(%edx),%xmm5
+ DB 15,40,186,99,64,0,0 ; movaps 0x4063(%edx),%xmm7
+ DB 15,89,248 ; mulps %xmm0,%xmm7
+ DB 15,92,239 ; subps %xmm7,%xmm5
+ DB 15,40,186,115,64,0,0 ; movaps 0x4073(%edx),%xmm7
+ DB 15,92,248 ; subps %xmm0,%xmm7
+ DB 15,40,130,131,64,0,0 ; movaps 0x4083(%edx),%xmm0
+ DB 15,94,199 ; divps %xmm7,%xmm0
+ DB 15,88,197 ; addps %xmm5,%xmm0
+ DB 15,89,130,147,64,0,0 ; mulps 0x4093(%edx),%xmm0
+ DB 102,15,91,192 ; cvtps2dq %xmm0,%xmm0
+ DB 243,15,16,105,20 ; movss 0x14(%ecx),%xmm5
+ DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
+ DB 15,88,232 ; addps %xmm0,%xmm5
+ DB 15,84,227 ; andps %xmm3,%xmm4
+ DB 15,85,221 ; andnps %xmm5,%xmm3
+ DB 15,86,220 ; orps %xmm4,%xmm3
+ DB 15,87,192 ; xorps %xmm0,%xmm0
+ DB 15,95,216 ; maxps %xmm0,%xmm3
+ DB 15,93,222 ; minps %xmm6,%xmm3
+ DB 141,72,8 ; lea 0x8(%eax),%ecx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 15,40,193 ; movaps %xmm1,%xmm0
+ DB 15,40,202 ; movaps %xmm2,%xmm1
+ DB 15,40,85,232 ; movaps -0x18(%ebp),%xmm2
+ DB 81 ; push %ecx
+ DB 255,117,8 ; pushl 0x8(%ebp)
+ DB 255,80,4 ; call *0x4(%eax)
+ DB 131,196,40 ; add $0x28,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -41884,38 +40705,35 @@ PUBLIC _sk_lab_to_xyz_sse2
_sk_lab_to_xyz_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 131,236,124 ; sub $0x7c,%esp
- DB 15,41,93,216 ; movaps %xmm3,-0x28(%ebp)
+ DB 131,236,24 ; sub $0x18,%esp
+ DB 15,41,93,232 ; movaps %xmm3,-0x18(%ebp)
DB 15,40,218 ; movaps %xmm2,%xmm3
DB 15,40,208 ; movaps %xmm0,%xmm2
- DB 232,0,0,0,0 ; call 4867 <_sk_lab_to_xyz_sse2+0x18>
+ DB 232,0,0,0,0 ; call 3881 <_sk_lab_to_xyz_sse2+0x15>
DB 88 ; pop %eax
- DB 15,89,144,105,82,0,0 ; mulps 0x5269(%eax),%xmm2
- DB 15,40,160,121,82,0,0 ; movaps 0x5279(%eax),%xmm4
+ DB 15,89,144,111,63,0,0 ; mulps 0x3f6f(%eax),%xmm2
+ DB 15,40,160,127,63,0,0 ; movaps 0x3f7f(%eax),%xmm4
DB 15,89,204 ; mulps %xmm4,%xmm1
- DB 15,40,168,137,82,0,0 ; movaps 0x5289(%eax),%xmm5
+ DB 15,40,168,143,63,0,0 ; movaps 0x3f8f(%eax),%xmm5
DB 15,88,205 ; addps %xmm5,%xmm1
DB 15,89,220 ; mulps %xmm4,%xmm3
DB 15,88,221 ; addps %xmm5,%xmm3
- DB 15,88,144,153,82,0,0 ; addps 0x5299(%eax),%xmm2
- DB 15,89,144,169,82,0,0 ; mulps 0x52a9(%eax),%xmm2
- DB 15,89,136,185,82,0,0 ; mulps 0x52b9(%eax),%xmm1
+ DB 15,88,144,159,63,0,0 ; addps 0x3f9f(%eax),%xmm2
+ DB 15,89,144,175,63,0,0 ; mulps 0x3faf(%eax),%xmm2
+ DB 15,89,136,191,63,0,0 ; mulps 0x3fbf(%eax),%xmm1
DB 15,88,202 ; addps %xmm2,%xmm1
- DB 15,89,152,201,82,0,0 ; mulps 0x52c9(%eax),%xmm3
+ DB 15,89,152,207,63,0,0 ; mulps 0x3fcf(%eax),%xmm3
DB 15,40,234 ; movaps %xmm2,%xmm5
DB 15,92,235 ; subps %xmm3,%xmm5
DB 15,40,193 ; movaps %xmm1,%xmm0
DB 15,89,192 ; mulps %xmm0,%xmm0
DB 15,89,193 ; mulps %xmm1,%xmm0
- DB 15,40,152,217,82,0,0 ; movaps 0x52d9(%eax),%xmm3
+ DB 15,40,152,223,63,0,0 ; movaps 0x3fdf(%eax),%xmm3
DB 15,40,227 ; movaps %xmm3,%xmm4
DB 15,194,224,1 ; cmpltps %xmm0,%xmm4
- DB 15,40,176,233,82,0,0 ; movaps 0x52e9(%eax),%xmm6
+ DB 15,40,176,239,63,0,0 ; movaps 0x3fef(%eax),%xmm6
DB 15,88,206 ; addps %xmm6,%xmm1
- DB 15,40,184,249,82,0,0 ; movaps 0x52f9(%eax),%xmm7
+ DB 15,40,184,255,63,0,0 ; movaps 0x3fff(%eax),%xmm7
DB 15,89,207 ; mulps %xmm7,%xmm1
DB 15,84,196 ; andps %xmm4,%xmm0
DB 15,85,225 ; andnps %xmm1,%xmm4
@@ -41929,45 +40747,28 @@ _sk_lab_to_xyz_sse2 LABEL PROC
DB 15,89,215 ; mulps %xmm7,%xmm2
DB 15,84,193 ; andps %xmm1,%xmm0
DB 15,85,202 ; andnps %xmm2,%xmm1
- DB 139,77,8 ; mov 0x8(%ebp),%ecx
- DB 139,85,16 ; mov 0x10(%ebp),%edx
- DB 139,117,20 ; mov 0x14(%ebp),%esi
- DB 139,125,24 ; mov 0x18(%ebp),%edi
DB 15,86,200 ; orps %xmm0,%xmm1
DB 15,40,197 ; movaps %xmm5,%xmm0
DB 15,89,192 ; mulps %xmm0,%xmm0
DB 15,89,197 ; mulps %xmm5,%xmm0
DB 15,88,238 ; addps %xmm6,%xmm5
- DB 15,40,85,40 ; movaps 0x28(%ebp),%xmm2
DB 15,89,239 ; mulps %xmm7,%xmm5
- DB 15,40,117,56 ; movaps 0x38(%ebp),%xmm6
DB 15,194,216,1 ; cmpltps %xmm0,%xmm3
DB 15,84,195 ; andps %xmm3,%xmm0
DB 15,85,221 ; andnps %xmm5,%xmm3
- DB 15,40,109,72 ; movaps 0x48(%ebp),%xmm5
DB 15,86,216 ; orps %xmm0,%xmm3
- DB 15,40,69,88 ; movaps 0x58(%ebp),%xmm0
- DB 15,89,160,9,83,0,0 ; mulps 0x5309(%eax),%xmm4
- DB 15,89,152,25,83,0,0 ; mulps 0x5319(%eax),%xmm3
- DB 139,69,12 ; mov 0xc(%ebp),%eax
- DB 141,88,4 ; lea 0x4(%eax),%ebx
- DB 15,41,68,36,80 ; movaps %xmm0,0x50(%esp)
- DB 15,41,108,36,64 ; movaps %xmm5,0x40(%esp)
- DB 15,41,116,36,48 ; movaps %xmm6,0x30(%esp)
- DB 15,41,84,36,32 ; movaps %xmm2,0x20(%esp)
- DB 137,124,36,16 ; mov %edi,0x10(%esp)
- DB 137,116,36,12 ; mov %esi,0xc(%esp)
- DB 137,84,36,8 ; mov %edx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,12,36 ; mov %ecx,(%esp)
+ DB 139,77,12 ; mov 0xc(%ebp),%ecx
+ DB 15,89,160,15,64,0,0 ; mulps 0x400f(%eax),%xmm4
+ DB 15,89,152,31,64,0,0 ; mulps 0x401f(%eax),%xmm3
+ DB 141,65,4 ; lea 0x4(%ecx),%eax
+ DB 131,236,8 ; sub $0x8,%esp
DB 15,40,196 ; movaps %xmm4,%xmm0
DB 15,40,211 ; movaps %xmm3,%xmm2
- DB 15,40,93,216 ; movaps -0x28(%ebp),%xmm3
- DB 255,16 ; call *(%eax)
- DB 131,196,124 ; add $0x7c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 15,40,93,232 ; movaps -0x18(%ebp),%xmm3
+ DB 80 ; push %eax
+ DB 255,117,8 ; pushl 0x8(%ebp)
+ DB 255,17 ; call *(%ecx)
+ DB 131,196,40 ; add $0x28,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -41978,71 +40779,59 @@ _sk_load_a8_sse2 LABEL PROC
DB 83 ; push %ebx
DB 87 ; push %edi
DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 232,0,0,0,0 ; call 4996 <_sk_load_a8_sse2+0xe>
+ DB 131,236,12 ; sub $0xc,%esp
+ DB 232,0,0,0,0 ; call 3971 <_sk_load_a8_sse2+0xe>
DB 90 ; pop %edx
- DB 15,40,101,88 ; movaps 0x58(%ebp),%xmm4
- DB 15,40,85,72 ; movaps 0x48(%ebp),%xmm2
- DB 15,40,77,56 ; movaps 0x38(%ebp),%xmm1
- DB 102,15,111,69,40 ; movdqa 0x28(%ebp),%xmm0
DB 139,69,12 ; mov 0xc(%ebp),%eax
+ DB 139,77,8 ; mov 0x8(%ebp),%ecx
DB 139,56 ; mov (%eax),%edi
DB 139,119,4 ; mov 0x4(%edi),%esi
- DB 15,175,117,20 ; imul 0x14(%ebp),%esi
+ DB 15,175,113,4 ; imul 0x4(%ecx),%esi
DB 3,55 ; add (%edi),%esi
- DB 139,93,24 ; mov 0x18(%ebp),%ebx
+ DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 133,219 ; test %ebx,%ebx
- DB 139,125,16 ; mov 0x10(%ebp),%edi
- DB 117,101 ; jne 4a25 <_sk_load_a8_sse2+0x9d>
- DB 102,15,110,28,62 ; movd (%esi,%edi,1),%xmm3
- DB 102,15,96,216 ; punpcklbw %xmm0,%xmm3
- DB 102,15,97,216 ; punpcklwd %xmm0,%xmm3
- DB 102,15,219,154,250,81,0,0 ; pand 0x51fa(%edx),%xmm3
- DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,154,10,82,0,0 ; mulps 0x520a(%edx),%xmm3
- DB 141,72,8 ; lea 0x8(%eax),%ecx
- DB 15,41,100,36,80 ; movaps %xmm4,0x50(%esp)
- DB 15,41,84,36,64 ; movaps %xmm2,0x40(%esp)
- DB 15,41,76,36,48 ; movaps %xmm1,0x30(%esp)
- DB 102,15,127,68,36,32 ; movdqa %xmm0,0x20(%esp)
- DB 137,92,36,16 ; mov %ebx,0x10(%esp)
- DB 139,85,20 ; mov 0x14(%ebp),%edx
- DB 137,84,36,12 ; mov %edx,0xc(%esp)
- DB 137,124,36,8 ; mov %edi,0x8(%esp)
- DB 137,76,36,4 ; mov %ecx,0x4(%esp)
- DB 139,77,8 ; mov 0x8(%ebp),%ecx
- DB 137,12,36 ; mov %ecx,(%esp)
- DB 102,15,239,192 ; pxor %xmm0,%xmm0
- DB 15,87,201 ; xorps %xmm1,%xmm1
+ DB 139,57 ; mov (%ecx),%edi
+ DB 117,60 ; jne 39c8 <_sk_load_a8_sse2+0x65>
+ DB 102,15,110,4,62 ; movd (%esi,%edi,1),%xmm0
+ DB 102,15,96,192 ; punpcklbw %xmm0,%xmm0
+ DB 102,15,97,192 ; punpcklwd %xmm0,%xmm0
+ DB 102,15,219,130,63,63,0,0 ; pand 0x3f3f(%edx),%xmm0
+ DB 15,91,216 ; cvtdq2ps %xmm0,%xmm3
+ DB 15,89,154,79,63,0,0 ; mulps 0x3f4f(%edx),%xmm3
+ DB 141,80,8 ; lea 0x8(%eax),%edx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 15,87,192 ; xorps %xmm0,%xmm0
+ DB 102,15,87,201 ; xorpd %xmm1,%xmm1
DB 15,87,210 ; xorps %xmm2,%xmm2
+ DB 82 ; push %edx
+ DB 81 ; push %ecx
DB 255,80,4 ; call *0x4(%eax)
- DB 131,196,108 ; add $0x6c,%esp
+ DB 131,196,28 ; add $0x1c,%esp
DB 94 ; pop %esi
DB 95 ; pop %edi
DB 91 ; pop %ebx
DB 93 ; pop %ebp
DB 195 ; ret
- DB 137,217 ; mov %ebx,%ecx
- DB 128,225,3 ; and $0x3,%cl
- DB 128,249,1 ; cmp $0x1,%cl
- DB 116,53 ; je 4a64 <_sk_load_a8_sse2+0xdc>
- DB 102,15,239,219 ; pxor %xmm3,%xmm3
- DB 128,249,2 ; cmp $0x2,%cl
- DB 116,19 ; je 4a4b <_sk_load_a8_sse2+0xc3>
- DB 128,249,3 ; cmp $0x3,%cl
- DB 117,144 ; jne 49cd <_sk_load_a8_sse2+0x45>
- DB 15,182,76,62,2 ; movzbl 0x2(%esi,%edi,1),%ecx
- DB 102,15,110,217 ; movd %ecx,%xmm3
- DB 102,15,112,219,69 ; pshufd $0x45,%xmm3,%xmm3
- DB 15,183,12,62 ; movzwl (%esi,%edi,1),%ecx
- DB 102,15,110,233 ; movd %ecx,%xmm5
- DB 102,15,96,232 ; punpcklbw %xmm0,%xmm5
- DB 102,15,97,232 ; punpcklwd %xmm0,%xmm5
- DB 242,15,16,221 ; movsd %xmm5,%xmm3
- DB 233,105,255,255,255 ; jmp 49cd <_sk_load_a8_sse2+0x45>
- DB 15,182,12,62 ; movzbl (%esi,%edi,1),%ecx
- DB 102,15,110,217 ; movd %ecx,%xmm3
- DB 233,92,255,255,255 ; jmp 49cd <_sk_load_a8_sse2+0x45>
+ DB 128,227,3 ; and $0x3,%bl
+ DB 128,251,1 ; cmp $0x1,%bl
+ DB 116,50 ; je 3a02 <_sk_load_a8_sse2+0x9f>
+ DB 102,15,239,192 ; pxor %xmm0,%xmm0
+ DB 128,251,2 ; cmp $0x2,%bl
+ DB 116,19 ; je 39ec <_sk_load_a8_sse2+0x89>
+ DB 128,251,3 ; cmp $0x3,%bl
+ DB 117,187 ; jne 3999 <_sk_load_a8_sse2+0x36>
+ DB 15,182,92,62,2 ; movzbl 0x2(%esi,%edi,1),%ebx
+ DB 102,15,110,195 ; movd %ebx,%xmm0
+ DB 102,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm0
+ DB 15,183,52,62 ; movzwl (%esi,%edi,1),%esi
+ DB 102,15,110,206 ; movd %esi,%xmm1
+ DB 102,15,96,200 ; punpcklbw %xmm0,%xmm1
+ DB 102,15,97,200 ; punpcklwd %xmm0,%xmm1
+ DB 242,15,16,193 ; movsd %xmm1,%xmm0
+ DB 235,151 ; jmp 3999 <_sk_load_a8_sse2+0x36>
+ DB 15,182,52,62 ; movzbl (%esi,%edi,1),%esi
+ DB 102,15,110,198 ; movd %esi,%xmm0
+ DB 235,141 ; jmp 3999 <_sk_load_a8_sse2+0x36>
PUBLIC _sk_load_a8_dst_sse2
_sk_load_a8_dst_sse2 LABEL PROC
@@ -42051,74 +40840,67 @@ _sk_load_a8_dst_sse2 LABEL PROC
DB 83 ; push %ebx
DB 87 ; push %edi
DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 232,0,0,0,0 ; call 4a7f <_sk_load_a8_dst_sse2+0xe>
- DB 90 ; pop %edx
+ DB 131,236,12 ; sub $0xc,%esp
DB 139,69,12 ; mov 0xc(%ebp),%eax
- DB 139,56 ; mov (%eax),%edi
- DB 139,119,4 ; mov 0x4(%edi),%esi
- DB 15,175,117,20 ; imul 0x14(%ebp),%esi
- DB 3,55 ; add (%edi),%esi
- DB 139,93,24 ; mov 0x18(%ebp),%ebx
+ DB 139,77,8 ; mov 0x8(%ebp),%ecx
+ DB 139,49 ; mov (%ecx),%esi
+ DB 139,16 ; mov (%eax),%edx
+ DB 139,122,4 ; mov 0x4(%edx),%edi
+ DB 15,175,121,4 ; imul 0x4(%ecx),%edi
+ DB 3,58 ; add (%edx),%edi
+ DB 139,89,8 ; mov 0x8(%ecx),%ebx
+ DB 102,15,239,228 ; pxor %xmm4,%xmm4
+ DB 102,15,127,97,48 ; movdqa %xmm4,0x30(%ecx)
+ DB 102,15,127,97,32 ; movdqa %xmm4,0x20(%ecx)
+ DB 102,15,127,97,16 ; movdqa %xmm4,0x10(%ecx)
DB 133,219 ; test %ebx,%ebx
- DB 139,125,16 ; mov 0x10(%ebp),%edi
- DB 117,97 ; jne 4af9 <_sk_load_a8_dst_sse2+0x88>
- DB 102,15,110,36,62 ; movd (%esi,%edi,1),%xmm4
+ DB 232,0,0,0,0 ; call 3a45 <_sk_load_a8_dst_sse2+0x39>
+ DB 90 ; pop %edx
+ DB 117,54 ; jne 3a7e <_sk_load_a8_dst_sse2+0x72>
+ DB 102,15,110,36,55 ; movd (%edi,%esi,1),%xmm4
DB 102,15,96,224 ; punpcklbw %xmm0,%xmm4
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
- DB 102,15,219,162,49,81,0,0 ; pand 0x5131(%edx),%xmm4
+ DB 102,15,219,162,139,62,0,0 ; pand 0x3e8b(%edx),%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 102,15,87,237 ; xorpd %xmm5,%xmm5
- DB 15,89,162,65,81,0,0 ; mulps 0x5141(%edx),%xmm4
- DB 141,72,8 ; lea 0x8(%eax),%ecx
- DB 102,15,41,108,36,64 ; movapd %xmm5,0x40(%esp)
- DB 102,15,41,108,36,48 ; movapd %xmm5,0x30(%esp)
- DB 102,15,41,108,36,32 ; movapd %xmm5,0x20(%esp)
- DB 137,92,36,16 ; mov %ebx,0x10(%esp)
- DB 139,85,20 ; mov 0x14(%ebp),%edx
- DB 137,84,36,12 ; mov %edx,0xc(%esp)
- DB 137,124,36,8 ; mov %edi,0x8(%esp)
- DB 137,76,36,4 ; mov %ecx,0x4(%esp)
- DB 139,77,8 ; mov 0x8(%ebp),%ecx
- DB 137,12,36 ; mov %ecx,(%esp)
- DB 15,41,100,36,80 ; movaps %xmm4,0x50(%esp)
+ DB 15,89,162,155,62,0,0 ; mulps 0x3e9b(%edx),%xmm4
+ DB 15,41,97,64 ; movaps %xmm4,0x40(%ecx)
+ DB 141,80,8 ; lea 0x8(%eax),%edx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 82 ; push %edx
+ DB 81 ; push %ecx
DB 255,80,4 ; call *0x4(%eax)
- DB 131,196,108 ; add $0x6c,%esp
+ DB 131,196,28 ; add $0x1c,%esp
DB 94 ; pop %esi
DB 95 ; pop %edi
DB 91 ; pop %ebx
DB 93 ; pop %ebp
DB 195 ; ret
- DB 137,217 ; mov %ebx,%ecx
- DB 128,225,3 ; and $0x3,%cl
- DB 128,249,1 ; cmp $0x1,%cl
- DB 116,53 ; je 4b38 <_sk_load_a8_dst_sse2+0xc7>
- DB 102,15,239,228 ; pxor %xmm4,%xmm4
- DB 128,249,2 ; cmp $0x2,%cl
- DB 116,19 ; je 4b1f <_sk_load_a8_dst_sse2+0xae>
- DB 128,249,3 ; cmp $0x3,%cl
- DB 117,148 ; jne 4aa5 <_sk_load_a8_dst_sse2+0x34>
- DB 15,182,76,62,2 ; movzbl 0x2(%esi,%edi,1),%ecx
- DB 102,15,110,225 ; movd %ecx,%xmm4
+ DB 128,227,3 ; and $0x3,%bl
+ DB 128,251,1 ; cmp $0x1,%bl
+ DB 116,46 ; je 3ab4 <_sk_load_a8_dst_sse2+0xa8>
+ DB 128,251,2 ; cmp $0x2,%bl
+ DB 116,19 ; je 3a9e <_sk_load_a8_dst_sse2+0x92>
+ DB 128,251,3 ; cmp $0x3,%bl
+ DB 117,197 ; jne 3a55 <_sk_load_a8_dst_sse2+0x49>
+ DB 15,182,92,55,2 ; movzbl 0x2(%edi,%esi,1),%ebx
+ DB 102,15,110,227 ; movd %ebx,%xmm4
DB 102,15,112,228,69 ; pshufd $0x45,%xmm4,%xmm4
- DB 15,183,12,62 ; movzwl (%esi,%edi,1),%ecx
- DB 102,15,110,233 ; movd %ecx,%xmm5
+ DB 15,183,52,55 ; movzwl (%edi,%esi,1),%esi
+ DB 102,15,110,238 ; movd %esi,%xmm5
DB 102,15,96,232 ; punpcklbw %xmm0,%xmm5
DB 102,15,97,232 ; punpcklwd %xmm0,%xmm5
DB 242,15,16,229 ; movsd %xmm5,%xmm4
- DB 233,109,255,255,255 ; jmp 4aa5 <_sk_load_a8_dst_sse2+0x34>
- DB 15,182,12,62 ; movzbl (%esi,%edi,1),%ecx
- DB 102,15,110,225 ; movd %ecx,%xmm4
- DB 233,96,255,255,255 ; jmp 4aa5 <_sk_load_a8_dst_sse2+0x34>
+ DB 235,161 ; jmp 3a55 <_sk_load_a8_dst_sse2+0x49>
+ DB 15,182,52,55 ; movzbl (%edi,%esi,1),%esi
+ DB 102,15,110,230 ; movd %esi,%xmm4
+ DB 235,151 ; jmp 3a55 <_sk_load_a8_dst_sse2+0x49>
PUBLIC _sk_gather_a8_sse2
_sk_gather_a8_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
DB 87 ; push %edi
DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,8 ; mov (%eax),%ecx
DB 139,17 ; mov (%ecx),%edx
@@ -42146,43 +40928,28 @@ _sk_gather_a8_sse2 LABEL PROC
DB 102,15,126,206 ; movd %xmm1,%esi
DB 15,182,12,10 ; movzbl (%edx,%ecx,1),%ecx
DB 15,182,20,50 ; movzbl (%edx,%esi,1),%edx
- DB 232,0,0,0,0 ; call 4bbf <_sk_gather_a8_sse2+0x7a>
- DB 94 ; pop %esi
DB 193,226,8 ; shl $0x8,%edx
DB 9,202 ; or %ecx,%edx
- DB 139,77,8 ; mov 0x8(%ebp),%ecx
DB 102,15,196,194,0 ; pinsrw $0x0,%edx,%xmm0
- DB 139,85,16 ; mov 0x10(%ebp),%edx
DB 102,15,196,199,1 ; pinsrw $0x1,%edi,%xmm0
- DB 139,125,20 ; mov 0x14(%ebp),%edi
+ DB 232,0,0,0,0 ; call 3b43 <_sk_gather_a8_sse2+0x85>
+ DB 89 ; pop %ecx
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 102,15,96,193 ; punpcklbw %xmm1,%xmm0
DB 102,15,97,193 ; punpcklwd %xmm1,%xmm0
DB 15,91,216 ; cvtdq2ps %xmm0,%xmm3
- DB 15,89,158,17,80,0,0 ; mulps 0x5011(%esi),%xmm3
- DB 139,117,24 ; mov 0x18(%ebp),%esi
- DB 15,40,69,40 ; movaps 0x28(%ebp),%xmm0
- DB 15,40,77,56 ; movaps 0x38(%ebp),%xmm1
- DB 15,40,85,72 ; movaps 0x48(%ebp),%xmm2
- DB 15,40,101,88 ; movaps 0x58(%ebp),%xmm4
- DB 141,88,8 ; lea 0x8(%eax),%ebx
- DB 15,41,100,36,80 ; movaps %xmm4,0x50(%esp)
- DB 15,41,84,36,64 ; movaps %xmm2,0x40(%esp)
- DB 15,41,76,36,48 ; movaps %xmm1,0x30(%esp)
- DB 15,41,68,36,32 ; movaps %xmm0,0x20(%esp)
- DB 137,116,36,16 ; mov %esi,0x10(%esp)
- DB 137,124,36,12 ; mov %edi,0xc(%esp)
- DB 137,84,36,8 ; mov %edx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,12,36 ; mov %ecx,(%esp)
+ DB 15,89,153,173,61,0,0 ; mulps 0x3dad(%ecx),%xmm3
+ DB 141,72,8 ; lea 0x8(%eax),%ecx
+ DB 131,236,8 ; sub $0x8,%esp
DB 15,87,192 ; xorps %xmm0,%xmm0
- DB 15,87,201 ; xorps %xmm1,%xmm1
- DB 15,87,210 ; xorps %xmm2,%xmm2
+ DB 102,15,239,201 ; pxor %xmm1,%xmm1
+ DB 102,15,239,210 ; pxor %xmm2,%xmm2
+ DB 81 ; push %ecx
+ DB 255,117,8 ; pushl 0x8(%ebp)
DB 255,80,4 ; call *0x4(%eax)
- DB 131,196,108 ; add $0x6c,%esp
+ DB 131,196,16 ; add $0x10,%esp
DB 94 ; pop %esi
DB 95 ; pop %edi
- DB 91 ; pop %ebx
DB 93 ; pop %ebp
DB 195 ; ret
@@ -42193,45 +40960,34 @@ _sk_store_a8_sse2 LABEL PROC
DB 83 ; push %ebx
DB 87 ; push %edi
DB 86 ; push %esi
- DB 129,236,156,0,0,0 ; sub $0x9c,%esp
- DB 232,0,0,0,0 ; call 4c50 <_sk_store_a8_sse2+0x11>
- DB 95 ; pop %edi
- DB 15,40,117,88 ; movaps 0x58(%ebp),%xmm6
- DB 15,40,109,72 ; movaps 0x48(%ebp),%xmm5
+ DB 131,236,60 ; sub $0x3c,%esp
+ DB 232,0,0,0,0 ; call 3b87 <_sk_store_a8_sse2+0xe>
+ DB 94 ; pop %esi
DB 139,69,12 ; mov 0xc(%ebp),%eax
- DB 139,16 ; mov (%eax),%edx
- DB 139,114,4 ; mov 0x4(%edx),%esi
- DB 15,175,117,20 ; imul 0x14(%ebp),%esi
- DB 3,50 ; add (%edx),%esi
- DB 139,85,24 ; mov 0x18(%ebp),%edx
- DB 15,40,167,144,79,0,0 ; movaps 0x4f90(%edi),%xmm4
+ DB 139,77,8 ; mov 0x8(%ebp),%ecx
+ DB 139,56 ; mov (%eax),%edi
+ DB 139,87,4 ; mov 0x4(%edi),%edx
+ DB 15,175,81,4 ; imul 0x4(%ecx),%edx
+ DB 3,23 ; add (%edi),%edx
+ DB 139,89,8 ; mov 0x8(%ecx),%ebx
+ DB 15,40,166,121,61,0,0 ; movaps 0x3d79(%esi),%xmm4
DB 15,89,227 ; mulps %xmm3,%xmm4
DB 102,15,91,228 ; cvtps2dq %xmm4,%xmm4
DB 102,15,114,244,16 ; pslld $0x10,%xmm4
DB 102,15,114,228,16 ; psrad $0x10,%xmm4
DB 102,15,107,228 ; packssdw %xmm4,%xmm4
DB 102,15,103,228 ; packuswb %xmm4,%xmm4
- DB 133,210 ; test %edx,%edx
- DB 139,93,16 ; mov 0x10(%ebp),%ebx
- DB 15,40,125,40 ; movaps 0x28(%ebp),%xmm7
- DB 117,73 ; jne 4cde <_sk_store_a8_sse2+0x9f>
- DB 102,15,126,225 ; movd %xmm4,%ecx
- DB 137,12,30 ; mov %ecx,(%esi,%ebx,1)
- DB 141,72,8 ; lea 0x8(%eax),%ecx
- DB 15,41,116,36,80 ; movaps %xmm6,0x50(%esp)
- DB 15,41,108,36,64 ; movaps %xmm5,0x40(%esp)
- DB 15,40,101,56 ; movaps 0x38(%ebp),%xmm4
- DB 15,41,100,36,48 ; movaps %xmm4,0x30(%esp)
- DB 15,41,124,36,32 ; movaps %xmm7,0x20(%esp)
- DB 137,84,36,16 ; mov %edx,0x10(%esp)
- DB 139,85,20 ; mov 0x14(%ebp),%edx
- DB 137,84,36,12 ; mov %edx,0xc(%esp)
- DB 137,92,36,8 ; mov %ebx,0x8(%esp)
- DB 137,76,36,4 ; mov %ecx,0x4(%esp)
- DB 139,77,8 ; mov 0x8(%ebp),%ecx
- DB 137,12,36 ; mov %ecx,(%esp)
+ DB 133,219 ; test %ebx,%ebx
+ DB 139,57 ; mov (%ecx),%edi
+ DB 117,26 ; jne 3bdc <_sk_store_a8_sse2+0x63>
+ DB 102,15,126,230 ; movd %xmm4,%esi
+ DB 137,52,58 ; mov %esi,(%edx,%edi,1)
+ DB 141,80,8 ; lea 0x8(%eax),%edx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 82 ; push %edx
+ DB 81 ; push %ecx
DB 255,80,4 ; call *0x4(%eax)
- DB 129,196,156,0,0,0 ; add $0x9c,%esp
+ DB 131,196,76 ; add $0x4c,%esp
DB 94 ; pop %esi
DB 95 ; pop %edi
DB 91 ; pop %ebx
@@ -42239,29 +40995,28 @@ _sk_store_a8_sse2 LABEL PROC
DB 195 ; ret
DB 102,15,96,224 ; punpcklbw %xmm0,%xmm4
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
- DB 137,209 ; mov %edx,%ecx
- DB 128,225,3 ; and $0x3,%cl
- DB 128,249,1 ; cmp $0x1,%cl
- DB 116,60 ; je 4d2c <_sk_store_a8_sse2+0xed>
- DB 128,249,2 ; cmp $0x2,%cl
- DB 116,17 ; je 4d06 <_sk_store_a8_sse2+0xc7>
- DB 128,249,3 ; cmp $0x3,%cl
- DB 117,162 ; jne 4c9c <_sk_store_a8_sse2+0x5d>
+ DB 128,227,3 ; and $0x3,%bl
+ DB 128,251,1 ; cmp $0x1,%bl
+ DB 116,57 ; je 3c25 <_sk_store_a8_sse2+0xac>
+ DB 128,251,2 ; cmp $0x2,%bl
+ DB 116,17 ; je 3c02 <_sk_store_a8_sse2+0x89>
+ DB 128,251,3 ; cmp $0x3,%bl
+ DB 117,211 ; jne 3bc9 <_sk_store_a8_sse2+0x50>
DB 102,15,127,101,200 ; movdqa %xmm4,-0x38(%ebp)
- DB 138,77,208 ; mov -0x30(%ebp),%cl
- DB 136,76,30,2 ; mov %cl,0x2(%esi,%ebx,1)
+ DB 138,93,208 ; mov -0x30(%ebp),%bl
+ DB 136,92,58,2 ; mov %bl,0x2(%edx,%edi,1)
DB 102,15,112,228,212 ; pshufd $0xd4,%xmm4,%xmm4
- DB 102,15,219,167,160,79,0,0 ; pand 0x4fa0(%edi),%xmm4
+ DB 102,15,219,166,137,61,0,0 ; pand 0x3d89(%esi),%xmm4
DB 102,15,103,228 ; packuswb %xmm4,%xmm4
DB 102,15,103,228 ; packuswb %xmm4,%xmm4
DB 102,15,103,228 ; packuswb %xmm4,%xmm4
- DB 102,15,126,225 ; movd %xmm4,%ecx
- DB 102,137,12,30 ; mov %cx,(%esi,%ebx,1)
- DB 233,112,255,255,255 ; jmp 4c9c <_sk_store_a8_sse2+0x5d>
+ DB 102,15,126,230 ; movd %xmm4,%esi
+ DB 102,137,52,58 ; mov %si,(%edx,%edi,1)
+ DB 235,164 ; jmp 3bc9 <_sk_store_a8_sse2+0x50>
DB 102,15,127,101,216 ; movdqa %xmm4,-0x28(%ebp)
- DB 138,77,216 ; mov -0x28(%ebp),%cl
- DB 136,12,30 ; mov %cl,(%esi,%ebx,1)
- DB 233,96,255,255,255 ; jmp 4c9c <_sk_store_a8_sse2+0x5d>
+ DB 138,93,216 ; mov -0x28(%ebp),%bl
+ DB 136,28,58 ; mov %bl,(%edx,%edi,1)
+ DB 235,151 ; jmp 3bc9 <_sk_store_a8_sse2+0x50>
PUBLIC _sk_load_g8_sse2
_sk_load_g8_sse2 LABEL PROC
@@ -42270,71 +41025,59 @@ _sk_load_g8_sse2 LABEL PROC
DB 83 ; push %ebx
DB 87 ; push %edi
DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 232,0,0,0,0 ; call 4d4a <_sk_load_g8_sse2+0xe>
- DB 88 ; pop %eax
- DB 15,40,101,88 ; movaps 0x58(%ebp),%xmm4
- DB 15,40,93,72 ; movaps 0x48(%ebp),%xmm3
- DB 15,40,85,56 ; movaps 0x38(%ebp),%xmm2
- DB 15,40,77,40 ; movaps 0x28(%ebp),%xmm1
- DB 139,77,12 ; mov 0xc(%ebp),%ecx
- DB 139,57 ; mov (%ecx),%edi
+ DB 131,236,12 ; sub $0xc,%esp
+ DB 232,0,0,0,0 ; call 3c40 <_sk_load_g8_sse2+0xe>
+ DB 90 ; pop %edx
+ DB 139,69,12 ; mov 0xc(%ebp),%eax
+ DB 139,77,8 ; mov 0x8(%ebp),%ecx
+ DB 139,56 ; mov (%eax),%edi
DB 139,119,4 ; mov 0x4(%edi),%esi
- DB 15,175,117,20 ; imul 0x14(%ebp),%esi
+ DB 15,175,113,4 ; imul 0x4(%ecx),%esi
DB 3,55 ; add (%edi),%esi
- DB 139,93,24 ; mov 0x18(%ebp),%ebx
+ DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 133,219 ; test %ebx,%ebx
- DB 139,125,16 ; mov 0x10(%ebp),%edi
- DB 117,103 ; jne 4dda <_sk_load_g8_sse2+0x9e>
+ DB 139,57 ; mov (%ecx),%edi
+ DB 117,63 ; jne 3c9a <_sk_load_g8_sse2+0x68>
DB 102,15,110,4,62 ; movd (%esi,%edi,1),%xmm0
DB 102,15,96,192 ; punpcklbw %xmm0,%xmm0
DB 102,15,97,192 ; punpcklwd %xmm0,%xmm0
- DB 102,15,219,128,182,78,0,0 ; pand 0x4eb6(%eax),%xmm0
+ DB 102,15,219,130,224,60,0,0 ; pand 0x3ce0(%edx),%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,128,198,78,0,0 ; mulps 0x4ec6(%eax),%xmm0
- DB 141,81,8 ; lea 0x8(%ecx),%edx
- DB 15,41,100,36,80 ; movaps %xmm4,0x50(%esp)
- DB 15,41,92,36,64 ; movaps %xmm3,0x40(%esp)
- DB 15,41,84,36,48 ; movaps %xmm2,0x30(%esp)
- DB 15,41,76,36,32 ; movaps %xmm1,0x20(%esp)
- DB 137,92,36,16 ; mov %ebx,0x10(%esp)
- DB 139,117,20 ; mov 0x14(%ebp),%esi
- DB 137,116,36,12 ; mov %esi,0xc(%esp)
- DB 137,124,36,8 ; mov %edi,0x8(%esp)
- DB 137,84,36,4 ; mov %edx,0x4(%esp)
- DB 139,85,8 ; mov 0x8(%ebp),%edx
- DB 137,20,36 ; mov %edx,(%esp)
- DB 15,40,152,214,78,0,0 ; movaps 0x4ed6(%eax),%xmm3
+ DB 15,89,130,240,60,0,0 ; mulps 0x3cf0(%edx),%xmm0
+ DB 141,112,8 ; lea 0x8(%eax),%esi
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 15,40,154,0,61,0,0 ; movaps 0x3d00(%edx),%xmm3
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
- DB 255,81,4 ; call *0x4(%ecx)
- DB 131,196,108 ; add $0x6c,%esp
+ DB 86 ; push %esi
+ DB 81 ; push %ecx
+ DB 255,80,4 ; call *0x4(%eax)
+ DB 131,196,28 ; add $0x1c,%esp
DB 94 ; pop %esi
DB 95 ; pop %edi
DB 91 ; pop %ebx
DB 93 ; pop %ebp
DB 195 ; ret
- DB 137,218 ; mov %ebx,%edx
- DB 128,226,3 ; and $0x3,%dl
- DB 128,250,1 ; cmp $0x1,%dl
- DB 116,53 ; je 4e19 <_sk_load_g8_sse2+0xdd>
+ DB 128,227,3 ; and $0x3,%bl
+ DB 128,251,1 ; cmp $0x1,%bl
+ DB 116,50 ; je 3cd4 <_sk_load_g8_sse2+0xa2>
DB 102,15,239,192 ; pxor %xmm0,%xmm0
- DB 128,250,2 ; cmp $0x2,%dl
- DB 116,19 ; je 4e00 <_sk_load_g8_sse2+0xc4>
- DB 128,250,3 ; cmp $0x3,%dl
- DB 117,142 ; jne 4d80 <_sk_load_g8_sse2+0x44>
- DB 15,182,84,62,2 ; movzbl 0x2(%esi,%edi,1),%edx
- DB 102,15,110,194 ; movd %edx,%xmm0
+ DB 128,251,2 ; cmp $0x2,%bl
+ DB 116,19 ; je 3cbe <_sk_load_g8_sse2+0x8c>
+ DB 128,251,3 ; cmp $0x3,%bl
+ DB 117,184 ; jne 3c68 <_sk_load_g8_sse2+0x36>
+ DB 15,182,92,62,2 ; movzbl 0x2(%esi,%edi,1),%ebx
+ DB 102,15,110,195 ; movd %ebx,%xmm0
DB 102,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm0
- DB 15,183,20,62 ; movzwl (%esi,%edi,1),%edx
- DB 102,15,110,234 ; movd %edx,%xmm5
- DB 102,15,96,232 ; punpcklbw %xmm0,%xmm5
- DB 102,15,97,232 ; punpcklwd %xmm0,%xmm5
- DB 242,15,16,197 ; movsd %xmm5,%xmm0
- DB 233,103,255,255,255 ; jmp 4d80 <_sk_load_g8_sse2+0x44>
- DB 15,182,20,62 ; movzbl (%esi,%edi,1),%edx
- DB 102,15,110,194 ; movd %edx,%xmm0
- DB 233,90,255,255,255 ; jmp 4d80 <_sk_load_g8_sse2+0x44>
+ DB 15,183,52,62 ; movzwl (%esi,%edi,1),%esi
+ DB 102,15,110,206 ; movd %esi,%xmm1
+ DB 102,15,96,200 ; punpcklbw %xmm0,%xmm1
+ DB 102,15,97,200 ; punpcklwd %xmm0,%xmm1
+ DB 242,15,16,193 ; movsd %xmm1,%xmm0
+ DB 235,148 ; jmp 3c68 <_sk_load_g8_sse2+0x36>
+ DB 15,182,52,62 ; movzbl (%esi,%edi,1),%esi
+ DB 102,15,110,198 ; movd %esi,%xmm0
+ DB 235,138 ; jmp 3c68 <_sk_load_g8_sse2+0x36>
PUBLIC _sk_load_g8_dst_sse2
_sk_load_g8_dst_sse2 LABEL PROC
@@ -42343,74 +41086,68 @@ _sk_load_g8_dst_sse2 LABEL PROC
DB 83 ; push %ebx
DB 87 ; push %edi
DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 232,0,0,0,0 ; call 4e34 <_sk_load_g8_dst_sse2+0xe>
+ DB 131,236,12 ; sub $0xc,%esp
+ DB 232,0,0,0,0 ; call 3cec <_sk_load_g8_dst_sse2+0xe>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
+ DB 139,77,8 ; mov 0x8(%ebp),%ecx
DB 139,56 ; mov (%eax),%edi
DB 139,119,4 ; mov 0x4(%edi),%esi
- DB 15,175,117,20 ; imul 0x14(%ebp),%esi
+ DB 15,175,113,4 ; imul 0x4(%ecx),%esi
DB 3,55 ; add (%edi),%esi
- DB 139,93,24 ; mov 0x18(%ebp),%ebx
+ DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 133,219 ; test %ebx,%ebx
- DB 139,125,16 ; mov 0x10(%ebp),%edi
- DB 117,97 ; jne 4eae <_sk_load_g8_dst_sse2+0x88>
+ DB 139,57 ; mov (%ecx),%edi
+ DB 117,73 ; jne 3d50 <_sk_load_g8_dst_sse2+0x72>
DB 102,15,110,36,62 ; movd (%esi,%edi,1),%xmm4
DB 102,15,96,224 ; punpcklbw %xmm0,%xmm4
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
- DB 102,15,219,162,252,77,0,0 ; pand 0x4dfc(%edx),%xmm4
+ DB 102,15,219,162,100,60,0,0 ; pand 0x3c64(%edx),%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,162,12,78,0,0 ; mulps 0x4e0c(%edx),%xmm4
- DB 141,72,8 ; lea 0x8(%eax),%ecx
- DB 15,40,170,28,78,0,0 ; movaps 0x4e1c(%edx),%xmm5
- DB 15,41,108,36,80 ; movaps %xmm5,0x50(%esp)
- DB 137,92,36,16 ; mov %ebx,0x10(%esp)
- DB 139,85,20 ; mov 0x14(%ebp),%edx
- DB 137,84,36,12 ; mov %edx,0xc(%esp)
- DB 137,124,36,8 ; mov %edi,0x8(%esp)
- DB 137,76,36,4 ; mov %ecx,0x4(%esp)
- DB 139,77,8 ; mov 0x8(%ebp),%ecx
- DB 137,12,36 ; mov %ecx,(%esp)
- DB 15,41,100,36,64 ; movaps %xmm4,0x40(%esp)
- DB 15,41,100,36,48 ; movaps %xmm4,0x30(%esp)
- DB 15,41,100,36,32 ; movaps %xmm4,0x20(%esp)
+ DB 15,89,162,116,60,0,0 ; mulps 0x3c74(%edx),%xmm4
+ DB 15,41,97,48 ; movaps %xmm4,0x30(%ecx)
+ DB 15,41,97,32 ; movaps %xmm4,0x20(%ecx)
+ DB 15,41,97,16 ; movaps %xmm4,0x10(%ecx)
+ DB 15,40,162,132,60,0,0 ; movaps 0x3c84(%edx),%xmm4
+ DB 15,41,97,64 ; movaps %xmm4,0x40(%ecx)
+ DB 141,80,8 ; lea 0x8(%eax),%edx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 82 ; push %edx
+ DB 81 ; push %ecx
DB 255,80,4 ; call *0x4(%eax)
- DB 131,196,108 ; add $0x6c,%esp
+ DB 131,196,28 ; add $0x1c,%esp
DB 94 ; pop %esi
DB 95 ; pop %edi
DB 91 ; pop %ebx
DB 93 ; pop %ebp
DB 195 ; ret
- DB 137,217 ; mov %ebx,%ecx
- DB 128,225,3 ; and $0x3,%cl
- DB 128,249,1 ; cmp $0x1,%cl
- DB 116,53 ; je 4eed <_sk_load_g8_dst_sse2+0xc7>
+ DB 128,227,3 ; and $0x3,%bl
+ DB 128,251,1 ; cmp $0x1,%bl
+ DB 116,50 ; je 3d8a <_sk_load_g8_dst_sse2+0xac>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
- DB 128,249,2 ; cmp $0x2,%cl
- DB 116,19 ; je 4ed4 <_sk_load_g8_dst_sse2+0xae>
- DB 128,249,3 ; cmp $0x3,%cl
- DB 117,148 ; jne 4e5a <_sk_load_g8_dst_sse2+0x34>
- DB 15,182,76,62,2 ; movzbl 0x2(%esi,%edi,1),%ecx
- DB 102,15,110,225 ; movd %ecx,%xmm4
+ DB 128,251,2 ; cmp $0x2,%bl
+ DB 116,19 ; je 3d74 <_sk_load_g8_dst_sse2+0x96>
+ DB 128,251,3 ; cmp $0x3,%bl
+ DB 117,174 ; jne 3d14 <_sk_load_g8_dst_sse2+0x36>
+ DB 15,182,92,62,2 ; movzbl 0x2(%esi,%edi,1),%ebx
+ DB 102,15,110,227 ; movd %ebx,%xmm4
DB 102,15,112,228,69 ; pshufd $0x45,%xmm4,%xmm4
- DB 15,183,12,62 ; movzwl (%esi,%edi,1),%ecx
- DB 102,15,110,233 ; movd %ecx,%xmm5
+ DB 15,183,52,62 ; movzwl (%esi,%edi,1),%esi
+ DB 102,15,110,238 ; movd %esi,%xmm5
DB 102,15,96,232 ; punpcklbw %xmm0,%xmm5
DB 102,15,97,232 ; punpcklwd %xmm0,%xmm5
DB 242,15,16,229 ; movsd %xmm5,%xmm4
- DB 233,109,255,255,255 ; jmp 4e5a <_sk_load_g8_dst_sse2+0x34>
- DB 15,182,12,62 ; movzbl (%esi,%edi,1),%ecx
- DB 102,15,110,225 ; movd %ecx,%xmm4
- DB 233,96,255,255,255 ; jmp 4e5a <_sk_load_g8_dst_sse2+0x34>
+ DB 235,138 ; jmp 3d14 <_sk_load_g8_dst_sse2+0x36>
+ DB 15,182,52,62 ; movzbl (%esi,%edi,1),%esi
+ DB 102,15,110,230 ; movd %esi,%xmm4
+ DB 235,128 ; jmp 3d14 <_sk_load_g8_dst_sse2+0x36>
PUBLIC _sk_gather_g8_sse2
_sk_gather_g8_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
DB 87 ; push %edi
DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,8 ; mov (%eax),%ecx
DB 139,17 ; mov (%ecx),%edx
@@ -42438,44 +41175,28 @@ _sk_gather_g8_sse2 LABEL PROC
DB 102,15,126,206 ; movd %xmm1,%esi
DB 15,182,12,10 ; movzbl (%edx,%ecx,1),%ecx
DB 15,182,20,50 ; movzbl (%edx,%esi,1),%edx
- DB 232,0,0,0,0 ; call 4f74 <_sk_gather_g8_sse2+0x7a>
- DB 94 ; pop %esi
DB 193,226,8 ; shl $0x8,%edx
DB 9,202 ; or %ecx,%edx
DB 102,15,196,194,0 ; pinsrw $0x0,%edx,%xmm0
- DB 139,85,16 ; mov 0x10(%ebp),%edx
+ DB 232,0,0,0,0 ; call 3e14 <_sk_gather_g8_sse2+0x80>
+ DB 89 ; pop %ecx
DB 102,15,196,199,1 ; pinsrw $0x1,%edi,%xmm0
- DB 139,125,20 ; mov 0x14(%ebp),%edi
- DB 15,40,77,40 ; movaps 0x28(%ebp),%xmm1
- DB 15,40,85,56 ; movaps 0x38(%ebp),%xmm2
- DB 15,40,93,72 ; movaps 0x48(%ebp),%xmm3
- DB 15,40,101,88 ; movaps 0x58(%ebp),%xmm4
- DB 102,15,239,237 ; pxor %xmm5,%xmm5
- DB 102,15,96,197 ; punpcklbw %xmm5,%xmm0
- DB 102,15,97,197 ; punpcklwd %xmm5,%xmm0
+ DB 102,15,239,201 ; pxor %xmm1,%xmm1
+ DB 102,15,96,193 ; punpcklbw %xmm1,%xmm0
+ DB 102,15,97,193 ; punpcklwd %xmm1,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,134,236,76,0,0 ; mulps 0x4cec(%esi),%xmm0
- DB 139,93,24 ; mov 0x18(%ebp),%ebx
- DB 137,193 ; mov %eax,%ecx
- DB 141,65,8 ; lea 0x8(%ecx),%eax
- DB 15,41,100,36,80 ; movaps %xmm4,0x50(%esp)
- DB 15,41,92,36,64 ; movaps %xmm3,0x40(%esp)
- DB 15,41,84,36,48 ; movaps %xmm2,0x30(%esp)
- DB 15,41,76,36,32 ; movaps %xmm1,0x20(%esp)
- DB 137,92,36,16 ; mov %ebx,0x10(%esp)
- DB 137,124,36,12 ; mov %edi,0xc(%esp)
- DB 137,84,36,8 ; mov %edx,0x8(%esp)
- DB 137,68,36,4 ; mov %eax,0x4(%esp)
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 137,4,36 ; mov %eax,(%esp)
- DB 15,40,158,252,76,0,0 ; movaps 0x4cfc(%esi),%xmm3
+ DB 15,89,129,108,59,0,0 ; mulps 0x3b6c(%ecx),%xmm0
+ DB 141,80,8 ; lea 0x8(%eax),%edx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 15,40,153,124,59,0,0 ; movaps 0x3b7c(%ecx),%xmm3
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
- DB 255,81,4 ; call *0x4(%ecx)
- DB 131,196,108 ; add $0x6c,%esp
+ DB 82 ; push %edx
+ DB 255,117,8 ; pushl 0x8(%ebp)
+ DB 255,80,4 ; call *0x4(%eax)
+ DB 131,196,16 ; add $0x10,%esp
DB 94 ; pop %esi
DB 95 ; pop %edi
- DB 91 ; pop %ebx
DB 93 ; pop %ebp
DB 195 ; ret
@@ -42486,75 +41207,63 @@ _sk_load_565_sse2 LABEL PROC
DB 83 ; push %ebx
DB 87 ; push %edi
DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 232,0,0,0,0 ; call 5008 <_sk_load_565_sse2+0xe>
- DB 88 ; pop %eax
- DB 15,40,117,88 ; movaps 0x58(%ebp),%xmm6
- DB 15,40,109,72 ; movaps 0x48(%ebp),%xmm5
- DB 15,40,101,56 ; movaps 0x38(%ebp),%xmm4
- DB 15,40,93,40 ; movaps 0x28(%ebp),%xmm3
- DB 139,77,12 ; mov 0xc(%ebp),%ecx
- DB 139,57 ; mov (%ecx),%edi
+ DB 131,236,12 ; sub $0xc,%esp
+ DB 232,0,0,0,0 ; call 3e5f <_sk_load_565_sse2+0xe>
+ DB 90 ; pop %edx
+ DB 139,69,12 ; mov 0xc(%ebp),%eax
+ DB 139,77,8 ; mov 0x8(%ebp),%ecx
+ DB 139,56 ; mov (%eax),%edi
DB 139,119,4 ; mov 0x4(%edi),%esi
- DB 15,175,117,20 ; imul 0x14(%ebp),%esi
+ DB 15,175,113,4 ; imul 0x4(%ecx),%esi
DB 1,246 ; add %esi,%esi
DB 3,55 ; add (%edi),%esi
- DB 139,93,24 ; mov 0x18(%ebp),%ebx
+ DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 133,219 ; test %ebx,%ebx
- DB 139,125,16 ; mov 0x10(%ebp),%edi
- DB 15,133,137,0,0,0 ; jne 50c0 <_sk_load_565_sse2+0xc6>
+ DB 139,57 ; mov (%ecx),%edi
+ DB 117,97 ; jne 3edd <_sk_load_565_sse2+0x8c>
DB 243,15,126,20,126 ; movq (%esi,%edi,2),%xmm2
DB 102,15,97,208 ; punpcklwd %xmm0,%xmm2
- DB 102,15,111,128,120,76,0,0 ; movdqa 0x4c78(%eax),%xmm0
+ DB 102,15,111,130,65,59,0,0 ; movdqa 0x3b41(%edx),%xmm0
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,128,136,76,0,0 ; mulps 0x4c88(%eax),%xmm0
- DB 102,15,111,136,152,76,0,0 ; movdqa 0x4c98(%eax),%xmm1
+ DB 15,89,130,81,59,0,0 ; mulps 0x3b51(%edx),%xmm0
+ DB 102,15,111,138,97,59,0,0 ; movdqa 0x3b61(%edx),%xmm1
DB 102,15,219,202 ; pand %xmm2,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,136,168,76,0,0 ; mulps 0x4ca8(%eax),%xmm1
- DB 102,15,219,144,184,76,0,0 ; pand 0x4cb8(%eax),%xmm2
+ DB 15,89,138,113,59,0,0 ; mulps 0x3b71(%edx),%xmm1
+ DB 102,15,219,146,129,59,0,0 ; pand 0x3b81(%edx),%xmm2
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,144,200,76,0,0 ; mulps 0x4cc8(%eax),%xmm2
- DB 141,81,8 ; lea 0x8(%ecx),%edx
- DB 15,41,116,36,80 ; movaps %xmm6,0x50(%esp)
- DB 15,41,108,36,64 ; movaps %xmm5,0x40(%esp)
- DB 15,41,100,36,48 ; movaps %xmm4,0x30(%esp)
- DB 15,41,92,36,32 ; movaps %xmm3,0x20(%esp)
- DB 137,92,36,16 ; mov %ebx,0x10(%esp)
- DB 139,117,20 ; mov 0x14(%ebp),%esi
- DB 137,116,36,12 ; mov %esi,0xc(%esp)
- DB 137,124,36,8 ; mov %edi,0x8(%esp)
- DB 137,84,36,4 ; mov %edx,0x4(%esp)
- DB 139,85,8 ; mov 0x8(%ebp),%edx
- DB 137,20,36 ; mov %edx,(%esp)
- DB 15,40,152,216,76,0,0 ; movaps 0x4cd8(%eax),%xmm3
- DB 255,81,4 ; call *0x4(%ecx)
- DB 131,196,108 ; add $0x6c,%esp
+ DB 15,89,146,145,59,0,0 ; mulps 0x3b91(%edx),%xmm2
+ DB 141,112,8 ; lea 0x8(%eax),%esi
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 15,40,154,161,59,0,0 ; movaps 0x3ba1(%edx),%xmm3
+ DB 86 ; push %esi
+ DB 81 ; push %ecx
+ DB 255,80,4 ; call *0x4(%eax)
+ DB 131,196,28 ; add $0x1c,%esp
DB 94 ; pop %esi
DB 95 ; pop %edi
DB 91 ; pop %ebx
DB 93 ; pop %ebp
DB 195 ; ret
- DB 137,218 ; mov %ebx,%edx
- DB 128,226,3 ; and $0x3,%dl
- DB 128,250,1 ; cmp $0x1,%dl
- DB 116,50 ; je 50fc <_sk_load_565_sse2+0x102>
+ DB 128,227,3 ; and $0x3,%bl
+ DB 128,251,1 ; cmp $0x1,%bl
+ DB 116,46 ; je 3f13 <_sk_load_565_sse2+0xc2>
DB 102,15,239,210 ; pxor %xmm2,%xmm2
- DB 128,250,2 ; cmp $0x2,%dl
- DB 116,23 ; je 50ea <_sk_load_565_sse2+0xf0>
- DB 128,250,3 ; cmp $0x3,%dl
- DB 15,133,100,255,255,255 ; jne 5040 <_sk_load_565_sse2+0x46>
- DB 15,183,84,126,4 ; movzwl 0x4(%esi,%edi,2),%edx
- DB 102,15,110,194 ; movd %edx,%xmm0
+ DB 128,251,2 ; cmp $0x2,%bl
+ DB 116,19 ; je 3f01 <_sk_load_565_sse2+0xb0>
+ DB 128,251,3 ; cmp $0x3,%bl
+ DB 117,146 ; jne 3e85 <_sk_load_565_sse2+0x34>
+ DB 15,183,92,126,4 ; movzwl 0x4(%esi,%edi,2),%ebx
+ DB 102,15,110,195 ; movd %ebx,%xmm0
DB 102,15,112,208,69 ; pshufd $0x45,%xmm0,%xmm2
DB 102,15,110,4,126 ; movd (%esi,%edi,2),%xmm0
DB 102,15,97,192 ; punpcklwd %xmm0,%xmm0
DB 242,15,16,208 ; movsd %xmm0,%xmm2
- DB 233,68,255,255,255 ; jmp 5040 <_sk_load_565_sse2+0x46>
- DB 15,183,20,126 ; movzwl (%esi,%edi,2),%edx
- DB 102,15,110,210 ; movd %edx,%xmm2
- DB 233,55,255,255,255 ; jmp 5040 <_sk_load_565_sse2+0x46>
+ DB 233,114,255,255,255 ; jmp 3e85 <_sk_load_565_sse2+0x34>
+ DB 15,183,52,126 ; movzwl (%esi,%edi,2),%esi
+ DB 102,15,110,214 ; movd %esi,%xmm2
+ DB 233,101,255,255,255 ; jmp 3e85 <_sk_load_565_sse2+0x34>
PUBLIC _sk_load_565_dst_sse2
_sk_load_565_dst_sse2 LABEL PROC
@@ -42563,87 +41272,78 @@ _sk_load_565_dst_sse2 LABEL PROC
DB 83 ; push %ebx
DB 87 ; push %edi
DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 232,0,0,0,0 ; call 5117 <_sk_load_565_dst_sse2+0xe>
+ DB 131,236,12 ; sub $0xc,%esp
+ DB 232,0,0,0,0 ; call 3f2e <_sk_load_565_dst_sse2+0xe>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
+ DB 139,77,8 ; mov 0x8(%ebp),%ecx
DB 139,56 ; mov (%eax),%edi
DB 139,119,4 ; mov 0x4(%edi),%esi
- DB 15,175,117,20 ; imul 0x14(%ebp),%esi
+ DB 15,175,113,4 ; imul 0x4(%ecx),%esi
DB 1,246 ; add %esi,%esi
DB 3,55 ; add (%edi),%esi
- DB 139,93,24 ; mov 0x18(%ebp),%ebx
+ DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 133,219 ; test %ebx,%ebx
- DB 139,125,16 ; mov 0x10(%ebp),%edi
- DB 15,133,137,0,0,0 ; jne 51bf <_sk_load_565_dst_sse2+0xb6>
+ DB 139,57 ; mov (%ecx),%edi
+ DB 117,113 ; jne 3fbc <_sk_load_565_dst_sse2+0x9c>
DB 243,15,126,36,126 ; movq (%esi,%edi,2),%xmm4
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
- DB 102,15,111,170,217,75,0,0 ; movdqa 0x4bd9(%edx),%xmm5
+ DB 102,15,111,170,226,58,0,0 ; movdqa 0x3ae2(%edx),%xmm5
DB 102,15,219,236 ; pand %xmm4,%xmm5
DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
- DB 15,89,170,233,75,0,0 ; mulps 0x4be9(%edx),%xmm5
- DB 102,15,111,178,249,75,0,0 ; movdqa 0x4bf9(%edx),%xmm6
- DB 102,15,219,244 ; pand %xmm4,%xmm6
- DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
- DB 15,89,178,9,76,0,0 ; mulps 0x4c09(%edx),%xmm6
- DB 102,15,219,162,25,76,0,0 ; pand 0x4c19(%edx),%xmm4
+ DB 15,89,170,242,58,0,0 ; mulps 0x3af2(%edx),%xmm5
+ DB 15,41,105,16 ; movaps %xmm5,0x10(%ecx)
+ DB 102,15,111,170,2,59,0,0 ; movdqa 0x3b02(%edx),%xmm5
+ DB 102,15,219,236 ; pand %xmm4,%xmm5
+ DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
+ DB 15,89,170,18,59,0,0 ; mulps 0x3b12(%edx),%xmm5
+ DB 15,41,105,32 ; movaps %xmm5,0x20(%ecx)
+ DB 102,15,219,162,34,59,0,0 ; pand 0x3b22(%edx),%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,162,41,76,0,0 ; mulps 0x4c29(%edx),%xmm4
- DB 141,72,8 ; lea 0x8(%eax),%ecx
- DB 15,40,186,57,76,0,0 ; movaps 0x4c39(%edx),%xmm7
- DB 15,41,124,36,80 ; movaps %xmm7,0x50(%esp)
- DB 137,92,36,16 ; mov %ebx,0x10(%esp)
- DB 139,85,20 ; mov 0x14(%ebp),%edx
- DB 137,84,36,12 ; mov %edx,0xc(%esp)
- DB 137,124,36,8 ; mov %edi,0x8(%esp)
- DB 137,76,36,4 ; mov %ecx,0x4(%esp)
- DB 139,77,8 ; mov 0x8(%ebp),%ecx
- DB 137,12,36 ; mov %ecx,(%esp)
- DB 15,41,100,36,64 ; movaps %xmm4,0x40(%esp)
- DB 15,41,116,36,48 ; movaps %xmm6,0x30(%esp)
- DB 15,41,108,36,32 ; movaps %xmm5,0x20(%esp)
+ DB 15,89,162,50,59,0,0 ; mulps 0x3b32(%edx),%xmm4
+ DB 15,41,97,48 ; movaps %xmm4,0x30(%ecx)
+ DB 15,40,162,66,59,0,0 ; movaps 0x3b42(%edx),%xmm4
+ DB 15,41,97,64 ; movaps %xmm4,0x40(%ecx)
+ DB 141,80,8 ; lea 0x8(%eax),%edx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 82 ; push %edx
+ DB 81 ; push %ecx
DB 255,80,4 ; call *0x4(%eax)
- DB 131,196,108 ; add $0x6c,%esp
+ DB 131,196,28 ; add $0x1c,%esp
DB 94 ; pop %esi
DB 95 ; pop %edi
DB 91 ; pop %ebx
DB 93 ; pop %ebp
DB 195 ; ret
- DB 137,217 ; mov %ebx,%ecx
- DB 128,225,3 ; and $0x3,%cl
- DB 128,249,1 ; cmp $0x1,%cl
- DB 116,50 ; je 51fb <_sk_load_565_dst_sse2+0xf2>
+ DB 128,227,3 ; and $0x3,%bl
+ DB 128,251,1 ; cmp $0x1,%bl
+ DB 116,46 ; je 3ff2 <_sk_load_565_dst_sse2+0xd2>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
- DB 128,249,2 ; cmp $0x2,%cl
- DB 116,23 ; je 51e9 <_sk_load_565_dst_sse2+0xe0>
- DB 128,249,3 ; cmp $0x3,%cl
- DB 15,133,100,255,255,255 ; jne 513f <_sk_load_565_dst_sse2+0x36>
- DB 15,183,76,126,4 ; movzwl 0x4(%esi,%edi,2),%ecx
- DB 102,15,110,225 ; movd %ecx,%xmm4
+ DB 128,251,2 ; cmp $0x2,%bl
+ DB 116,19 ; je 3fe0 <_sk_load_565_dst_sse2+0xc0>
+ DB 128,251,3 ; cmp $0x3,%bl
+ DB 117,130 ; jne 3f54 <_sk_load_565_dst_sse2+0x34>
+ DB 15,183,92,126,4 ; movzwl 0x4(%esi,%edi,2),%ebx
+ DB 102,15,110,227 ; movd %ebx,%xmm4
DB 102,15,112,228,69 ; pshufd $0x45,%xmm4,%xmm4
DB 102,15,110,44,126 ; movd (%esi,%edi,2),%xmm5
DB 102,15,97,232 ; punpcklwd %xmm0,%xmm5
DB 242,15,16,229 ; movsd %xmm5,%xmm4
- DB 233,68,255,255,255 ; jmp 513f <_sk_load_565_dst_sse2+0x36>
- DB 15,183,12,126 ; movzwl (%esi,%edi,2),%ecx
- DB 102,15,110,225 ; movd %ecx,%xmm4
- DB 233,55,255,255,255 ; jmp 513f <_sk_load_565_dst_sse2+0x36>
+ DB 233,98,255,255,255 ; jmp 3f54 <_sk_load_565_dst_sse2+0x34>
+ DB 15,183,52,126 ; movzwl (%esi,%edi,2),%esi
+ DB 102,15,110,230 ; movd %esi,%xmm4
+ DB 233,85,255,255,255 ; jmp 3f54 <_sk_load_565_dst_sse2+0x34>
PUBLIC _sk_gather_565_sse2
_sk_gather_565_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 232,0,0,0,0 ; call 5216 <_sk_gather_565_sse2+0xe>
- DB 88 ; pop %eax
- DB 139,85,12 ; mov 0xc(%ebp),%edx
- DB 139,50 ; mov (%edx),%esi
- DB 139,62 ; mov (%esi),%edi
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 139,69,12 ; mov 0xc(%ebp),%eax
+ DB 139,8 ; mov (%eax),%ecx
+ DB 139,17 ; mov (%ecx),%edx
DB 243,15,91,201 ; cvttps2dq %xmm1,%xmm1
- DB 102,15,110,86,4 ; movd 0x4(%esi),%xmm2
+ DB 102,15,110,81,4 ; movd 0x4(%ecx),%xmm2
DB 102,15,112,210,0 ; pshufd $0x0,%xmm2,%xmm2
DB 102,15,112,217,245 ; pshufd $0xf5,%xmm1,%xmm3
DB 102,15,244,218 ; pmuludq %xmm2,%xmm3
@@ -42653,56 +41353,41 @@ _sk_gather_565_sse2 LABEL PROC
DB 102,15,98,203 ; punpckldq %xmm3,%xmm1
DB 243,15,91,192 ; cvttps2dq %xmm0,%xmm0
DB 102,15,254,193 ; paddd %xmm1,%xmm0
- DB 102,15,126,198 ; movd %xmm0,%esi
+ DB 102,15,126,193 ; movd %xmm0,%ecx
DB 102,15,112,200,229 ; pshufd $0xe5,%xmm0,%xmm1
- DB 102,15,196,20,119,0 ; pinsrw $0x0,(%edi,%esi,2),%xmm2
- DB 102,15,126,206 ; movd %xmm1,%esi
+ DB 102,15,196,20,74,0 ; pinsrw $0x0,(%edx,%ecx,2),%xmm2
+ DB 102,15,126,201 ; movd %xmm1,%ecx
DB 102,15,112,200,78 ; pshufd $0x4e,%xmm0,%xmm1
- DB 102,15,196,20,119,1 ; pinsrw $0x1,(%edi,%esi,2),%xmm2
- DB 102,15,126,206 ; movd %xmm1,%esi
+ DB 102,15,196,20,74,1 ; pinsrw $0x1,(%edx,%ecx,2),%xmm2
+ DB 102,15,126,201 ; movd %xmm1,%ecx
DB 102,15,112,192,231 ; pshufd $0xe7,%xmm0,%xmm0
- DB 15,183,52,119 ; movzwl (%edi,%esi,2),%esi
- DB 102,15,196,214,2 ; pinsrw $0x2,%esi,%xmm2
- DB 102,15,126,198 ; movd %xmm0,%esi
- DB 15,183,52,119 ; movzwl (%edi,%esi,2),%esi
- DB 139,125,16 ; mov 0x10(%ebp),%edi
- DB 102,15,196,214,3 ; pinsrw $0x3,%esi,%xmm2
- DB 139,117,20 ; mov 0x14(%ebp),%esi
- DB 15,40,93,40 ; movaps 0x28(%ebp),%xmm3
- DB 15,40,101,56 ; movaps 0x38(%ebp),%xmm4
- DB 15,40,109,72 ; movaps 0x48(%ebp),%xmm5
- DB 15,40,117,88 ; movaps 0x58(%ebp),%xmm6
+ DB 15,183,12,74 ; movzwl (%edx,%ecx,2),%ecx
+ DB 102,15,196,209,2 ; pinsrw $0x2,%ecx,%xmm2
+ DB 102,15,126,193 ; movd %xmm0,%ecx
+ DB 15,183,12,74 ; movzwl (%edx,%ecx,2),%ecx
+ DB 232,0,0,0,0 ; call 407a <_sk_gather_565_sse2+0x7b>
+ DB 90 ; pop %edx
+ DB 102,15,196,209,3 ; pinsrw $0x3,%ecx,%xmm2
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 102,15,97,208 ; punpcklwd %xmm0,%xmm2
- DB 102,15,111,128,74,75,0,0 ; movdqa 0x4b4a(%eax),%xmm0
+ DB 102,15,111,130,6,58,0,0 ; movdqa 0x3a06(%edx),%xmm0
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,128,90,75,0,0 ; mulps 0x4b5a(%eax),%xmm0
- DB 102,15,111,136,106,75,0,0 ; movdqa 0x4b6a(%eax),%xmm1
+ DB 15,89,130,22,58,0,0 ; mulps 0x3a16(%edx),%xmm0
+ DB 102,15,111,138,38,58,0,0 ; movdqa 0x3a26(%edx),%xmm1
DB 102,15,219,202 ; pand %xmm2,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,136,122,75,0,0 ; mulps 0x4b7a(%eax),%xmm1
- DB 102,15,219,144,138,75,0,0 ; pand 0x4b8a(%eax),%xmm2
+ DB 15,89,138,54,58,0,0 ; mulps 0x3a36(%edx),%xmm1
+ DB 102,15,219,146,70,58,0,0 ; pand 0x3a46(%edx),%xmm2
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,144,154,75,0,0 ; mulps 0x4b9a(%eax),%xmm2
- DB 139,93,24 ; mov 0x18(%ebp),%ebx
- DB 141,74,8 ; lea 0x8(%edx),%ecx
- DB 15,41,116,36,80 ; movaps %xmm6,0x50(%esp)
- DB 15,41,108,36,64 ; movaps %xmm5,0x40(%esp)
- DB 15,41,100,36,48 ; movaps %xmm4,0x30(%esp)
- DB 15,41,92,36,32 ; movaps %xmm3,0x20(%esp)
- DB 137,92,36,16 ; mov %ebx,0x10(%esp)
- DB 137,116,36,12 ; mov %esi,0xc(%esp)
- DB 137,124,36,8 ; mov %edi,0x8(%esp)
- DB 137,76,36,4 ; mov %ecx,0x4(%esp)
- DB 139,77,8 ; mov 0x8(%ebp),%ecx
- DB 137,12,36 ; mov %ecx,(%esp)
- DB 15,40,152,170,75,0,0 ; movaps 0x4baa(%eax),%xmm3
- DB 255,82,4 ; call *0x4(%edx)
- DB 131,196,108 ; add $0x6c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 15,89,146,86,58,0,0 ; mulps 0x3a56(%edx),%xmm2
+ DB 141,72,8 ; lea 0x8(%eax),%ecx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 15,40,154,102,58,0,0 ; movaps 0x3a66(%edx),%xmm3
+ DB 81 ; push %ecx
+ DB 255,117,8 ; pushl 0x8(%ebp)
+ DB 255,80,4 ; call *0x4(%eax)
+ DB 131,196,24 ; add $0x18,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -42713,65 +41398,49 @@ _sk_store_565_sse2 LABEL PROC
DB 83 ; push %ebx
DB 87 ; push %edi
DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 232,0,0,0,0 ; call 5338 <_sk_store_565_sse2+0xe>
- DB 88 ; pop %eax
- DB 15,40,160,152,74,0,0 ; movaps 0x4a98(%eax),%xmm4
- DB 15,40,232 ; movaps %xmm0,%xmm5
- DB 15,89,236 ; mulps %xmm4,%xmm5
- DB 102,15,91,237 ; cvtps2dq %xmm5,%xmm5
- DB 102,15,114,245,11 ; pslld $0xb,%xmm5
- DB 15,40,176,168,74,0,0 ; movaps 0x4aa8(%eax),%xmm6
- DB 15,89,241 ; mulps %xmm1,%xmm6
- DB 102,15,91,246 ; cvtps2dq %xmm6,%xmm6
- DB 102,15,114,246,5 ; pslld $0x5,%xmm6
- DB 102,15,235,245 ; por %xmm5,%xmm6
- DB 139,85,24 ; mov 0x18(%ebp),%edx
- DB 139,125,20 ; mov 0x14(%ebp),%edi
+ DB 131,236,12 ; sub $0xc,%esp
+ DB 232,0,0,0,0 ; call 40ed <_sk_store_565_sse2+0xe>
+ DB 95 ; pop %edi
DB 139,69,12 ; mov 0xc(%ebp),%eax
+ DB 139,77,8 ; mov 0x8(%ebp),%ecx
DB 139,48 ; mov (%eax),%esi
- DB 139,94,4 ; mov 0x4(%esi),%ebx
- DB 15,175,223 ; imul %edi,%ebx
- DB 1,219 ; add %ebx,%ebx
- DB 3,30 ; add (%esi),%ebx
- DB 139,117,16 ; mov 0x10(%ebp),%esi
+ DB 139,86,4 ; mov 0x4(%esi),%edx
+ DB 15,175,81,4 ; imul 0x4(%ecx),%edx
+ DB 1,210 ; add %edx,%edx
+ DB 3,22 ; add (%esi),%edx
+ DB 139,49 ; mov (%ecx),%esi
+ DB 15,40,167,3,58,0,0 ; movaps 0x3a03(%edi),%xmm4
+ DB 15,40,175,19,58,0,0 ; movaps 0x3a13(%edi),%xmm5
+ DB 139,89,8 ; mov 0x8(%ecx),%ebx
+ DB 15,40,240 ; movaps %xmm0,%xmm6
+ DB 15,89,244 ; mulps %xmm4,%xmm6
+ DB 102,15,91,246 ; cvtps2dq %xmm6,%xmm6
+ DB 102,15,114,246,11 ; pslld $0xb,%xmm6
+ DB 15,89,233 ; mulps %xmm1,%xmm5
+ DB 102,15,91,237 ; cvtps2dq %xmm5,%xmm5
+ DB 102,15,114,245,5 ; pslld $0x5,%xmm5
+ DB 102,15,235,238 ; por %xmm6,%xmm5
DB 15,89,226 ; mulps %xmm2,%xmm4
DB 102,15,91,228 ; cvtps2dq %xmm4,%xmm4
- DB 102,15,86,230 ; orpd %xmm6,%xmm4
+ DB 102,15,86,229 ; orpd %xmm5,%xmm4
DB 102,15,114,244,16 ; pslld $0x10,%xmm4
DB 102,15,114,228,16 ; psrad $0x10,%xmm4
DB 102,15,107,228 ; packssdw %xmm4,%xmm4
DB 102,15,126,101,232 ; movd %xmm4,-0x18(%ebp)
DB 102,15,112,236,229 ; pshufd $0xe5,%xmm4,%xmm5
DB 102,15,126,109,236 ; movd %xmm5,-0x14(%ebp)
- DB 133,210 ; test %edx,%edx
- DB 15,40,125,56 ; movaps 0x38(%ebp),%xmm7
- DB 15,40,117,40 ; movaps 0x28(%ebp),%xmm6
- DB 117,90 ; jne 540c <_sk_store_565_sse2+0xe2>
- DB 137,208 ; mov %edx,%eax
- DB 137,250 ; mov %edi,%edx
+ DB 133,219 ; test %ebx,%ebx
+ DB 117,34 ; jne 4181 <_sk_store_565_sse2+0xa2>
DB 102,15,126,231 ; movd %xmm4,%edi
- DB 102,15,126,233 ; movd %xmm5,%ecx
- DB 137,60,115 ; mov %edi,(%ebx,%esi,2)
- DB 137,215 ; mov %edx,%edi
- DB 137,194 ; mov %eax,%edx
- DB 139,69,12 ; mov 0xc(%ebp),%eax
- DB 137,76,115,4 ; mov %ecx,0x4(%ebx,%esi,2)
- DB 141,72,8 ; lea 0x8(%eax),%ecx
- DB 15,40,101,88 ; movaps 0x58(%ebp),%xmm4
- DB 15,41,100,36,80 ; movaps %xmm4,0x50(%esp)
- DB 15,40,101,72 ; movaps 0x48(%ebp),%xmm4
- DB 15,41,100,36,64 ; movaps %xmm4,0x40(%esp)
- DB 15,41,124,36,48 ; movaps %xmm7,0x30(%esp)
- DB 15,41,116,36,32 ; movaps %xmm6,0x20(%esp)
- DB 137,84,36,16 ; mov %edx,0x10(%esp)
- DB 137,124,36,12 ; mov %edi,0xc(%esp)
- DB 137,116,36,8 ; mov %esi,0x8(%esp)
- DB 137,76,36,4 ; mov %ecx,0x4(%esp)
- DB 139,77,8 ; mov 0x8(%ebp),%ecx
- DB 137,12,36 ; mov %ecx,(%esp)
+ DB 102,15,126,235 ; movd %xmm5,%ebx
+ DB 137,60,114 ; mov %edi,(%edx,%esi,2)
+ DB 137,92,114,4 ; mov %ebx,0x4(%edx,%esi,2)
+ DB 141,80,8 ; lea 0x8(%eax),%edx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 82 ; push %edx
+ DB 81 ; push %ecx
DB 255,80,4 ; call *0x4(%eax)
- DB 131,196,108 ; add $0x6c,%esp
+ DB 131,196,28 ; add $0x1c,%esp
DB 94 ; pop %esi
DB 95 ; pop %edi
DB 91 ; pop %ebx
@@ -42779,27 +41448,22 @@ _sk_store_565_sse2 LABEL PROC
DB 195 ; ret
DB 243,15,126,101,232 ; movq -0x18(%ebp),%xmm4
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
- DB 137,209 ; mov %edx,%ecx
- DB 128,225,3 ; and $0x3,%cl
- DB 128,249,1 ; cmp $0x1,%cl
- DB 116,41 ; je 5448 <_sk_store_565_sse2+0x11e>
- DB 128,249,2 ; cmp $0x2,%cl
- DB 116,19 ; je 5437 <_sk_store_565_sse2+0x10d>
- DB 128,249,3 ; cmp $0x3,%cl
- DB 117,163 ; jne 53cc <_sk_store_565_sse2+0xa2>
- DB 137,249 ; mov %edi,%ecx
+ DB 128,227,3 ; and $0x3,%bl
+ DB 128,251,1 ; cmp $0x1,%bl
+ DB 116,37 ; je 41b7 <_sk_store_565_sse2+0xd8>
+ DB 128,251,2 ; cmp $0x2,%bl
+ DB 116,15 ; je 41a6 <_sk_store_565_sse2+0xc7>
+ DB 128,251,3 ; cmp $0x3,%bl
+ DB 117,210 ; jne 416e <_sk_store_565_sse2+0x8f>
DB 102,15,197,252,4 ; pextrw $0x4,%xmm4,%edi
- DB 102,137,124,115,4 ; mov %di,0x4(%ebx,%esi,2)
- DB 137,207 ; mov %ecx,%edi
+ DB 102,137,124,114,4 ; mov %di,0x4(%edx,%esi,2)
DB 102,15,112,228,212 ; pshufd $0xd4,%xmm4,%xmm4
DB 242,15,112,228,232 ; pshuflw $0xe8,%xmm4,%xmm4
- DB 102,15,126,36,115 ; movd %xmm4,(%ebx,%esi,2)
- DB 235,132 ; jmp 53cc <_sk_store_565_sse2+0xa2>
- DB 137,249 ; mov %edi,%ecx
+ DB 102,15,126,36,114 ; movd %xmm4,(%edx,%esi,2)
+ DB 235,183 ; jmp 416e <_sk_store_565_sse2+0x8f>
DB 102,15,126,231 ; movd %xmm4,%edi
- DB 102,137,60,115 ; mov %di,(%ebx,%esi,2)
- DB 137,207 ; mov %ecx,%edi
- DB 233,115,255,255,255 ; jmp 53cc <_sk_store_565_sse2+0xa2>
+ DB 102,137,60,114 ; mov %di,(%edx,%esi,2)
+ DB 235,173 ; jmp 416e <_sk_store_565_sse2+0x8f>
PUBLIC _sk_load_4444_sse2
_sk_load_4444_sse2 LABEL PROC
@@ -42808,78 +41472,66 @@ _sk_load_4444_sse2 LABEL PROC
DB 83 ; push %ebx
DB 87 ; push %edi
DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 232,0,0,0,0 ; call 5467 <_sk_load_4444_sse2+0xe>
+ DB 131,236,12 ; sub $0xc,%esp
+ DB 232,0,0,0,0 ; call 41cf <_sk_load_4444_sse2+0xe>
DB 90 ; pop %edx
- DB 15,40,125,88 ; movaps 0x58(%ebp),%xmm7
- DB 15,40,117,72 ; movaps 0x48(%ebp),%xmm6
- DB 15,40,109,56 ; movaps 0x38(%ebp),%xmm5
- DB 15,40,101,40 ; movaps 0x28(%ebp),%xmm4
DB 139,69,12 ; mov 0xc(%ebp),%eax
+ DB 139,77,8 ; mov 0x8(%ebp),%ecx
DB 139,56 ; mov (%eax),%edi
DB 139,119,4 ; mov 0x4(%edi),%esi
- DB 15,175,117,20 ; imul 0x14(%ebp),%esi
+ DB 15,175,113,4 ; imul 0x4(%ecx),%esi
DB 1,246 ; add %esi,%esi
DB 3,55 ; add (%edi),%esi
- DB 139,93,24 ; mov 0x18(%ebp),%ebx
+ DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 133,219 ; test %ebx,%ebx
- DB 139,125,16 ; mov 0x10(%ebp),%edi
- DB 15,133,152,0,0,0 ; jne 552e <_sk_load_4444_sse2+0xd5>
+ DB 139,57 ; mov (%ecx),%edi
+ DB 117,112 ; jne 425c <_sk_load_4444_sse2+0x9b>
DB 243,15,126,28,126 ; movq (%esi,%edi,2),%xmm3
DB 102,15,97,216 ; punpcklwd %xmm0,%xmm3
- DB 102,15,111,130,137,73,0,0 ; movdqa 0x4989(%edx),%xmm0
+ DB 102,15,111,130,65,57,0,0 ; movdqa 0x3941(%edx),%xmm0
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,130,153,73,0,0 ; mulps 0x4999(%edx),%xmm0
- DB 102,15,111,138,169,73,0,0 ; movdqa 0x49a9(%edx),%xmm1
+ DB 15,89,130,81,57,0,0 ; mulps 0x3951(%edx),%xmm0
+ DB 102,15,111,138,97,57,0,0 ; movdqa 0x3961(%edx),%xmm1
DB 102,15,219,203 ; pand %xmm3,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,138,185,73,0,0 ; mulps 0x49b9(%edx),%xmm1
- DB 102,15,111,146,201,73,0,0 ; movdqa 0x49c9(%edx),%xmm2
+ DB 15,89,138,113,57,0,0 ; mulps 0x3971(%edx),%xmm1
+ DB 102,15,111,146,129,57,0,0 ; movdqa 0x3981(%edx),%xmm2
DB 102,15,219,211 ; pand %xmm3,%xmm2
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,146,217,73,0,0 ; mulps 0x49d9(%edx),%xmm2
- DB 102,15,219,154,233,73,0,0 ; pand 0x49e9(%edx),%xmm3
+ DB 15,89,146,145,57,0,0 ; mulps 0x3991(%edx),%xmm2
+ DB 102,15,219,154,161,57,0,0 ; pand 0x39a1(%edx),%xmm3
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,154,249,73,0,0 ; mulps 0x49f9(%edx),%xmm3
- DB 141,72,8 ; lea 0x8(%eax),%ecx
- DB 15,41,124,36,80 ; movaps %xmm7,0x50(%esp)
- DB 15,41,116,36,64 ; movaps %xmm6,0x40(%esp)
- DB 15,41,108,36,48 ; movaps %xmm5,0x30(%esp)
- DB 15,41,100,36,32 ; movaps %xmm4,0x20(%esp)
- DB 137,92,36,16 ; mov %ebx,0x10(%esp)
- DB 139,85,20 ; mov 0x14(%ebp),%edx
- DB 137,84,36,12 ; mov %edx,0xc(%esp)
- DB 137,124,36,8 ; mov %edi,0x8(%esp)
- DB 137,76,36,4 ; mov %ecx,0x4(%esp)
- DB 139,77,8 ; mov 0x8(%ebp),%ecx
- DB 137,12,36 ; mov %ecx,(%esp)
+ DB 15,89,154,177,57,0,0 ; mulps 0x39b1(%edx),%xmm3
+ DB 141,80,8 ; lea 0x8(%eax),%edx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 82 ; push %edx
+ DB 81 ; push %ecx
DB 255,80,4 ; call *0x4(%eax)
- DB 131,196,108 ; add $0x6c,%esp
+ DB 131,196,28 ; add $0x1c,%esp
DB 94 ; pop %esi
DB 95 ; pop %edi
DB 91 ; pop %ebx
DB 93 ; pop %ebp
DB 195 ; ret
- DB 137,217 ; mov %ebx,%ecx
- DB 128,225,3 ; and $0x3,%cl
- DB 128,249,1 ; cmp $0x1,%cl
- DB 116,50 ; je 556a <_sk_load_4444_sse2+0x111>
+ DB 128,227,3 ; and $0x3,%bl
+ DB 128,251,1 ; cmp $0x1,%bl
+ DB 116,46 ; je 4292 <_sk_load_4444_sse2+0xd1>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
- DB 128,249,2 ; cmp $0x2,%cl
- DB 116,23 ; je 5558 <_sk_load_4444_sse2+0xff>
- DB 128,249,3 ; cmp $0x3,%cl
- DB 15,133,85,255,255,255 ; jne 549f <_sk_load_4444_sse2+0x46>
- DB 15,183,76,126,4 ; movzwl 0x4(%esi,%edi,2),%ecx
- DB 102,15,110,193 ; movd %ecx,%xmm0
+ DB 128,251,2 ; cmp $0x2,%bl
+ DB 116,19 ; je 4280 <_sk_load_4444_sse2+0xbf>
+ DB 128,251,3 ; cmp $0x3,%bl
+ DB 117,131 ; jne 41f5 <_sk_load_4444_sse2+0x34>
+ DB 15,183,92,126,4 ; movzwl 0x4(%esi,%edi,2),%ebx
+ DB 102,15,110,195 ; movd %ebx,%xmm0
DB 102,15,112,216,69 ; pshufd $0x45,%xmm0,%xmm3
DB 102,15,110,4,126 ; movd (%esi,%edi,2),%xmm0
DB 102,15,97,192 ; punpcklwd %xmm0,%xmm0
DB 242,15,16,216 ; movsd %xmm0,%xmm3
- DB 233,53,255,255,255 ; jmp 549f <_sk_load_4444_sse2+0x46>
- DB 15,183,12,126 ; movzwl (%esi,%edi,2),%ecx
- DB 102,15,110,217 ; movd %ecx,%xmm3
- DB 233,40,255,255,255 ; jmp 549f <_sk_load_4444_sse2+0x46>
+ DB 233,99,255,255,255 ; jmp 41f5 <_sk_load_4444_sse2+0x34>
+ DB 15,183,52,126 ; movzwl (%esi,%edi,2),%esi
+ DB 102,15,110,222 ; movd %esi,%xmm3
+ DB 233,86,255,255,255 ; jmp 41f5 <_sk_load_4444_sse2+0x34>
PUBLIC _sk_load_4444_dst_sse2
_sk_load_4444_dst_sse2 LABEL PROC
@@ -42888,91 +41540,81 @@ _sk_load_4444_dst_sse2 LABEL PROC
DB 83 ; push %ebx
DB 87 ; push %edi
DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 232,0,0,0,0 ; call 5585 <_sk_load_4444_dst_sse2+0xe>
+ DB 131,236,12 ; sub $0xc,%esp
+ DB 232,0,0,0,0 ; call 42ad <_sk_load_4444_dst_sse2+0xe>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
+ DB 139,77,8 ; mov 0x8(%ebp),%ecx
DB 139,56 ; mov (%eax),%edi
DB 139,119,4 ; mov 0x4(%edi),%esi
- DB 15,175,117,20 ; imul 0x14(%ebp),%esi
+ DB 15,175,113,4 ; imul 0x4(%ecx),%esi
DB 1,246 ; add %esi,%esi
DB 3,55 ; add (%edi),%esi
- DB 139,93,24 ; mov 0x18(%ebp),%ebx
+ DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 133,219 ; test %ebx,%ebx
- DB 139,125,16 ; mov 0x10(%ebp),%edi
- DB 15,133,152,0,0,0 ; jne 563c <_sk_load_4444_dst_sse2+0xc5>
+ DB 139,57 ; mov (%ecx),%edi
+ DB 15,133,128,0,0,0 ; jne 434e <_sk_load_4444_dst_sse2+0xaf>
DB 243,15,126,36,126 ; movq (%esi,%edi,2),%xmm4
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
- DB 102,15,111,170,235,72,0,0 ; movdqa 0x48eb(%edx),%xmm5
+ DB 102,15,111,170,227,56,0,0 ; movdqa 0x38e3(%edx),%xmm5
DB 102,15,219,236 ; pand %xmm4,%xmm5
DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
- DB 15,89,170,251,72,0,0 ; mulps 0x48fb(%edx),%xmm5
- DB 102,15,111,178,11,73,0,0 ; movdqa 0x490b(%edx),%xmm6
- DB 102,15,219,244 ; pand %xmm4,%xmm6
- DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
- DB 15,89,178,27,73,0,0 ; mulps 0x491b(%edx),%xmm6
- DB 102,15,111,186,43,73,0,0 ; movdqa 0x492b(%edx),%xmm7
- DB 102,15,219,252 ; pand %xmm4,%xmm7
- DB 15,91,255 ; cvtdq2ps %xmm7,%xmm7
- DB 15,89,186,59,73,0,0 ; mulps 0x493b(%edx),%xmm7
- DB 102,15,219,162,75,73,0,0 ; pand 0x494b(%edx),%xmm4
+ DB 15,89,170,243,56,0,0 ; mulps 0x38f3(%edx),%xmm5
+ DB 15,41,105,16 ; movaps %xmm5,0x10(%ecx)
+ DB 102,15,111,170,3,57,0,0 ; movdqa 0x3903(%edx),%xmm5
+ DB 102,15,219,236 ; pand %xmm4,%xmm5
+ DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
+ DB 15,89,170,19,57,0,0 ; mulps 0x3913(%edx),%xmm5
+ DB 15,41,105,32 ; movaps %xmm5,0x20(%ecx)
+ DB 102,15,111,170,35,57,0,0 ; movdqa 0x3923(%edx),%xmm5
+ DB 102,15,219,236 ; pand %xmm4,%xmm5
+ DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
+ DB 15,89,170,51,57,0,0 ; mulps 0x3933(%edx),%xmm5
+ DB 15,41,105,48 ; movaps %xmm5,0x30(%ecx)
+ DB 102,15,219,162,67,57,0,0 ; pand 0x3943(%edx),%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,162,91,73,0,0 ; mulps 0x495b(%edx),%xmm4
- DB 141,72,8 ; lea 0x8(%eax),%ecx
- DB 137,92,36,16 ; mov %ebx,0x10(%esp)
- DB 139,85,20 ; mov 0x14(%ebp),%edx
- DB 137,84,36,12 ; mov %edx,0xc(%esp)
- DB 137,124,36,8 ; mov %edi,0x8(%esp)
- DB 137,76,36,4 ; mov %ecx,0x4(%esp)
- DB 139,77,8 ; mov 0x8(%ebp),%ecx
- DB 137,12,36 ; mov %ecx,(%esp)
- DB 15,41,100,36,80 ; movaps %xmm4,0x50(%esp)
- DB 15,41,124,36,64 ; movaps %xmm7,0x40(%esp)
- DB 15,41,116,36,48 ; movaps %xmm6,0x30(%esp)
- DB 15,41,108,36,32 ; movaps %xmm5,0x20(%esp)
+ DB 15,89,162,83,57,0,0 ; mulps 0x3953(%edx),%xmm4
+ DB 15,41,97,64 ; movaps %xmm4,0x40(%ecx)
+ DB 141,80,8 ; lea 0x8(%eax),%edx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 82 ; push %edx
+ DB 81 ; push %ecx
DB 255,80,4 ; call *0x4(%eax)
- DB 131,196,108 ; add $0x6c,%esp
+ DB 131,196,28 ; add $0x1c,%esp
DB 94 ; pop %esi
DB 95 ; pop %edi
DB 91 ; pop %ebx
DB 93 ; pop %ebp
DB 195 ; ret
- DB 137,217 ; mov %ebx,%ecx
- DB 128,225,3 ; and $0x3,%cl
- DB 128,249,1 ; cmp $0x1,%cl
- DB 116,50 ; je 5678 <_sk_load_4444_dst_sse2+0x101>
+ DB 128,227,3 ; and $0x3,%bl
+ DB 128,251,1 ; cmp $0x1,%bl
+ DB 116,50 ; je 4388 <_sk_load_4444_dst_sse2+0xe9>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
- DB 128,249,2 ; cmp $0x2,%cl
- DB 116,23 ; je 5666 <_sk_load_4444_dst_sse2+0xef>
- DB 128,249,3 ; cmp $0x3,%cl
- DB 15,133,85,255,255,255 ; jne 55ad <_sk_load_4444_dst_sse2+0x36>
- DB 15,183,76,126,4 ; movzwl 0x4(%esi,%edi,2),%ecx
- DB 102,15,110,225 ; movd %ecx,%xmm4
+ DB 128,251,2 ; cmp $0x2,%bl
+ DB 116,23 ; je 4376 <_sk_load_4444_dst_sse2+0xd7>
+ DB 128,251,3 ; cmp $0x3,%bl
+ DB 15,133,111,255,255,255 ; jne 42d7 <_sk_load_4444_dst_sse2+0x38>
+ DB 15,183,92,126,4 ; movzwl 0x4(%esi,%edi,2),%ebx
+ DB 102,15,110,227 ; movd %ebx,%xmm4
DB 102,15,112,228,69 ; pshufd $0x45,%xmm4,%xmm4
DB 102,15,110,44,126 ; movd (%esi,%edi,2),%xmm5
DB 102,15,97,232 ; punpcklwd %xmm0,%xmm5
DB 242,15,16,229 ; movsd %xmm5,%xmm4
- DB 233,53,255,255,255 ; jmp 55ad <_sk_load_4444_dst_sse2+0x36>
- DB 15,183,12,126 ; movzwl (%esi,%edi,2),%ecx
- DB 102,15,110,225 ; movd %ecx,%xmm4
- DB 233,40,255,255,255 ; jmp 55ad <_sk_load_4444_dst_sse2+0x36>
+ DB 233,79,255,255,255 ; jmp 42d7 <_sk_load_4444_dst_sse2+0x38>
+ DB 15,183,52,126 ; movzwl (%esi,%edi,2),%esi
+ DB 102,15,110,230 ; movd %esi,%xmm4
+ DB 233,66,255,255,255 ; jmp 42d7 <_sk_load_4444_dst_sse2+0x38>
PUBLIC _sk_gather_4444_sse2
_sk_gather_4444_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 232,0,0,0,0 ; call 5693 <_sk_gather_4444_sse2+0xe>
- DB 90 ; pop %edx
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,77,12 ; mov 0xc(%ebp),%ecx
- DB 139,49 ; mov (%ecx),%esi
- DB 139,62 ; mov (%esi),%edi
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 139,69,12 ; mov 0xc(%ebp),%eax
+ DB 139,8 ; mov (%eax),%ecx
+ DB 139,17 ; mov (%ecx),%edx
DB 243,15,91,201 ; cvttps2dq %xmm1,%xmm1
- DB 102,15,110,86,4 ; movd 0x4(%esi),%xmm2
+ DB 102,15,110,81,4 ; movd 0x4(%ecx),%xmm2
DB 102,15,112,210,0 ; pshufd $0x0,%xmm2,%xmm2
DB 102,15,112,217,245 ; pshufd $0xf5,%xmm1,%xmm3
DB 102,15,244,218 ; pmuludq %xmm2,%xmm3
@@ -42982,58 +41624,44 @@ _sk_gather_4444_sse2 LABEL PROC
DB 102,15,98,203 ; punpckldq %xmm3,%xmm1
DB 243,15,91,192 ; cvttps2dq %xmm0,%xmm0
DB 102,15,254,193 ; paddd %xmm1,%xmm0
- DB 102,15,126,198 ; movd %xmm0,%esi
+ DB 102,15,126,193 ; movd %xmm0,%ecx
DB 102,15,112,200,229 ; pshufd $0xe5,%xmm0,%xmm1
- DB 102,15,196,28,119,0 ; pinsrw $0x0,(%edi,%esi,2),%xmm3
- DB 102,15,126,206 ; movd %xmm1,%esi
+ DB 102,15,196,28,74,0 ; pinsrw $0x0,(%edx,%ecx,2),%xmm3
+ DB 102,15,126,201 ; movd %xmm1,%ecx
DB 102,15,112,200,78 ; pshufd $0x4e,%xmm0,%xmm1
- DB 102,15,196,28,119,1 ; pinsrw $0x1,(%edi,%esi,2),%xmm3
- DB 102,15,126,206 ; movd %xmm1,%esi
+ DB 102,15,196,28,74,1 ; pinsrw $0x1,(%edx,%ecx,2),%xmm3
+ DB 102,15,126,201 ; movd %xmm1,%ecx
DB 102,15,112,192,231 ; pshufd $0xe7,%xmm0,%xmm0
- DB 15,183,52,119 ; movzwl (%edi,%esi,2),%esi
- DB 102,15,196,222,2 ; pinsrw $0x2,%esi,%xmm3
- DB 102,15,126,198 ; movd %xmm0,%esi
- DB 15,183,60,119 ; movzwl (%edi,%esi,2),%edi
- DB 139,117,16 ; mov 0x10(%ebp),%esi
- DB 102,15,196,223,3 ; pinsrw $0x3,%edi,%xmm3
- DB 139,125,20 ; mov 0x14(%ebp),%edi
+ DB 15,183,12,74 ; movzwl (%edx,%ecx,2),%ecx
+ DB 102,15,196,217,2 ; pinsrw $0x2,%ecx,%xmm3
+ DB 102,15,126,193 ; movd %xmm0,%ecx
+ DB 15,183,12,74 ; movzwl (%edx,%ecx,2),%ecx
+ DB 102,15,196,217,3 ; pinsrw $0x3,%ecx,%xmm3
+ DB 232,0,0,0,0 ; call 4415 <_sk_gather_4444_sse2+0x80>
+ DB 89 ; pop %ecx
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 102,15,97,216 ; punpcklwd %xmm0,%xmm3
- DB 102,15,111,130,93,72,0,0 ; movdqa 0x485d(%edx),%xmm0
+ DB 102,15,111,129,251,55,0,0 ; movdqa 0x37fb(%ecx),%xmm0
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,130,109,72,0,0 ; mulps 0x486d(%edx),%xmm0
- DB 102,15,111,138,125,72,0,0 ; movdqa 0x487d(%edx),%xmm1
+ DB 15,89,129,11,56,0,0 ; mulps 0x380b(%ecx),%xmm0
+ DB 102,15,111,137,27,56,0,0 ; movdqa 0x381b(%ecx),%xmm1
DB 102,15,219,203 ; pand %xmm3,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,138,141,72,0,0 ; mulps 0x488d(%edx),%xmm1
- DB 102,15,111,146,157,72,0,0 ; movdqa 0x489d(%edx),%xmm2
+ DB 15,89,137,43,56,0,0 ; mulps 0x382b(%ecx),%xmm1
+ DB 102,15,111,145,59,56,0,0 ; movdqa 0x383b(%ecx),%xmm2
DB 102,15,219,211 ; pand %xmm3,%xmm2
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,146,173,72,0,0 ; mulps 0x48ad(%edx),%xmm2
- DB 102,15,219,154,189,72,0,0 ; pand 0x48bd(%edx),%xmm3
+ DB 15,89,145,75,56,0,0 ; mulps 0x384b(%ecx),%xmm2
+ DB 102,15,219,153,91,56,0,0 ; pand 0x385b(%ecx),%xmm3
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,154,205,72,0,0 ; mulps 0x48cd(%edx),%xmm3
- DB 139,85,24 ; mov 0x18(%ebp),%edx
- DB 15,40,101,40 ; movaps 0x28(%ebp),%xmm4
- DB 15,40,109,56 ; movaps 0x38(%ebp),%xmm5
- DB 15,40,117,72 ; movaps 0x48(%ebp),%xmm6
- DB 15,40,125,88 ; movaps 0x58(%ebp),%xmm7
- DB 141,89,8 ; lea 0x8(%ecx),%ebx
- DB 15,41,124,36,80 ; movaps %xmm7,0x50(%esp)
- DB 15,41,116,36,64 ; movaps %xmm6,0x40(%esp)
- DB 15,41,108,36,48 ; movaps %xmm5,0x30(%esp)
- DB 15,41,100,36,32 ; movaps %xmm4,0x20(%esp)
- DB 137,84,36,16 ; mov %edx,0x10(%esp)
- DB 137,124,36,12 ; mov %edi,0xc(%esp)
- DB 137,116,36,8 ; mov %esi,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
- DB 255,81,4 ; call *0x4(%ecx)
- DB 131,196,108 ; add $0x6c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 15,89,153,107,56,0,0 ; mulps 0x386b(%ecx),%xmm3
+ DB 141,72,8 ; lea 0x8(%eax),%ecx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 81 ; push %ecx
+ DB 255,117,8 ; pushl 0x8(%ebp)
+ DB 255,80,4 ; call *0x4(%eax)
+ DB 131,196,24 ; add $0x18,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -43044,10 +41672,19 @@ _sk_store_4444_sse2 LABEL PROC
DB 83 ; push %ebx
DB 87 ; push %edi
DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 232,0,0,0,0 ; call 57c4 <_sk_store_4444_sse2+0xe>
- DB 88 ; pop %eax
- DB 15,40,160,172,71,0,0 ; movaps 0x47ac(%eax),%xmm4
+ DB 131,236,12 ; sub $0xc,%esp
+ DB 232,0,0,0,0 ; call 4492 <_sk_store_4444_sse2+0xe>
+ DB 95 ; pop %edi
+ DB 139,69,12 ; mov 0xc(%ebp),%eax
+ DB 139,77,8 ; mov 0x8(%ebp),%ecx
+ DB 139,48 ; mov (%eax),%esi
+ DB 139,86,4 ; mov 0x4(%esi),%edx
+ DB 15,175,81,4 ; imul 0x4(%ecx),%edx
+ DB 1,210 ; add %edx,%edx
+ DB 3,22 ; add (%esi),%edx
+ DB 139,49 ; mov (%ecx),%esi
+ DB 15,40,167,254,55,0,0 ; movaps 0x37fe(%edi),%xmm4
+ DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 15,40,232 ; movaps %xmm0,%xmm5
DB 15,89,236 ; mulps %xmm4,%xmm5
DB 102,15,91,237 ; cvtps2dq %xmm5,%xmm5
@@ -43064,15 +41701,6 @@ _sk_store_4444_sse2 LABEL PROC
DB 15,89,227 ; mulps %xmm3,%xmm4
DB 102,15,91,228 ; cvtps2dq %xmm4,%xmm4
DB 102,15,86,229 ; orpd %xmm5,%xmm4
- DB 139,85,24 ; mov 0x18(%ebp),%edx
- DB 139,125,20 ; mov 0x14(%ebp),%edi
- DB 139,69,12 ; mov 0xc(%ebp),%eax
- DB 139,48 ; mov (%eax),%esi
- DB 139,94,4 ; mov 0x4(%esi),%ebx
- DB 15,175,223 ; imul %edi,%ebx
- DB 1,219 ; add %ebx,%ebx
- DB 3,30 ; add (%esi),%ebx
- DB 139,117,16 ; mov 0x10(%ebp),%esi
DB 102,15,86,230 ; orpd %xmm6,%xmm4
DB 102,15,114,244,16 ; pslld $0x10,%xmm4
DB 102,15,114,228,16 ; psrad $0x10,%xmm4
@@ -43080,34 +41708,18 @@ _sk_store_4444_sse2 LABEL PROC
DB 102,15,126,101,232 ; movd %xmm4,-0x18(%ebp)
DB 102,15,112,236,229 ; pshufd $0xe5,%xmm4,%xmm5
DB 102,15,126,109,236 ; movd %xmm5,-0x14(%ebp)
- DB 133,210 ; test %edx,%edx
- DB 15,40,125,56 ; movaps 0x38(%ebp),%xmm7
- DB 15,40,117,40 ; movaps 0x28(%ebp),%xmm6
- DB 117,90 ; jne 58a7 <_sk_store_4444_sse2+0xf1>
- DB 137,208 ; mov %edx,%eax
- DB 137,250 ; mov %edi,%edx
+ DB 133,219 ; test %ebx,%ebx
+ DB 117,34 ; jne 4535 <_sk_store_4444_sse2+0xb1>
DB 102,15,126,231 ; movd %xmm4,%edi
- DB 102,15,126,233 ; movd %xmm5,%ecx
- DB 137,60,115 ; mov %edi,(%ebx,%esi,2)
- DB 137,215 ; mov %edx,%edi
- DB 137,194 ; mov %eax,%edx
- DB 139,69,12 ; mov 0xc(%ebp),%eax
- DB 137,76,115,4 ; mov %ecx,0x4(%ebx,%esi,2)
- DB 141,72,8 ; lea 0x8(%eax),%ecx
- DB 15,40,101,88 ; movaps 0x58(%ebp),%xmm4
- DB 15,41,100,36,80 ; movaps %xmm4,0x50(%esp)
- DB 15,40,101,72 ; movaps 0x48(%ebp),%xmm4
- DB 15,41,100,36,64 ; movaps %xmm4,0x40(%esp)
- DB 15,41,124,36,48 ; movaps %xmm7,0x30(%esp)
- DB 15,41,116,36,32 ; movaps %xmm6,0x20(%esp)
- DB 137,84,36,16 ; mov %edx,0x10(%esp)
- DB 137,124,36,12 ; mov %edi,0xc(%esp)
- DB 137,116,36,8 ; mov %esi,0x8(%esp)
- DB 137,76,36,4 ; mov %ecx,0x4(%esp)
- DB 139,77,8 ; mov 0x8(%ebp),%ecx
- DB 137,12,36 ; mov %ecx,(%esp)
+ DB 102,15,126,235 ; movd %xmm5,%ebx
+ DB 137,60,114 ; mov %edi,(%edx,%esi,2)
+ DB 137,92,114,4 ; mov %ebx,0x4(%edx,%esi,2)
+ DB 141,80,8 ; lea 0x8(%eax),%edx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 82 ; push %edx
+ DB 81 ; push %ecx
DB 255,80,4 ; call *0x4(%eax)
- DB 131,196,108 ; add $0x6c,%esp
+ DB 131,196,28 ; add $0x1c,%esp
DB 94 ; pop %esi
DB 95 ; pop %edi
DB 91 ; pop %ebx
@@ -43115,27 +41727,22 @@ _sk_store_4444_sse2 LABEL PROC
DB 195 ; ret
DB 243,15,126,101,232 ; movq -0x18(%ebp),%xmm4
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
- DB 137,209 ; mov %edx,%ecx
- DB 128,225,3 ; and $0x3,%cl
- DB 128,249,1 ; cmp $0x1,%cl
- DB 116,41 ; je 58e3 <_sk_store_4444_sse2+0x12d>
- DB 128,249,2 ; cmp $0x2,%cl
- DB 116,19 ; je 58d2 <_sk_store_4444_sse2+0x11c>
- DB 128,249,3 ; cmp $0x3,%cl
- DB 117,163 ; jne 5867 <_sk_store_4444_sse2+0xb1>
- DB 137,249 ; mov %edi,%ecx
+ DB 128,227,3 ; and $0x3,%bl
+ DB 128,251,1 ; cmp $0x1,%bl
+ DB 116,37 ; je 456b <_sk_store_4444_sse2+0xe7>
+ DB 128,251,2 ; cmp $0x2,%bl
+ DB 116,15 ; je 455a <_sk_store_4444_sse2+0xd6>
+ DB 128,251,3 ; cmp $0x3,%bl
+ DB 117,210 ; jne 4522 <_sk_store_4444_sse2+0x9e>
DB 102,15,197,252,4 ; pextrw $0x4,%xmm4,%edi
- DB 102,137,124,115,4 ; mov %di,0x4(%ebx,%esi,2)
- DB 137,207 ; mov %ecx,%edi
+ DB 102,137,124,114,4 ; mov %di,0x4(%edx,%esi,2)
DB 102,15,112,228,212 ; pshufd $0xd4,%xmm4,%xmm4
DB 242,15,112,228,232 ; pshuflw $0xe8,%xmm4,%xmm4
- DB 102,15,126,36,115 ; movd %xmm4,(%ebx,%esi,2)
- DB 235,132 ; jmp 5867 <_sk_store_4444_sse2+0xb1>
- DB 137,249 ; mov %edi,%ecx
+ DB 102,15,126,36,114 ; movd %xmm4,(%edx,%esi,2)
+ DB 235,183 ; jmp 4522 <_sk_store_4444_sse2+0x9e>
DB 102,15,126,231 ; movd %xmm4,%edi
- DB 102,137,60,115 ; mov %di,(%ebx,%esi,2)
- DB 137,207 ; mov %ecx,%edi
- DB 233,115,255,255,255 ; jmp 5867 <_sk_store_4444_sse2+0xb1>
+ DB 102,137,60,114 ; mov %di,(%edx,%esi,2)
+ DB 235,173 ; jmp 4522 <_sk_store_4444_sse2+0x9e>
PUBLIC _sk_load_8888_sse2
_sk_load_8888_sse2 LABEL PROC
@@ -43144,80 +41751,65 @@ _sk_load_8888_sse2 LABEL PROC
DB 83 ; push %ebx
DB 87 ; push %edi
DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 232,0,0,0,0 ; call 5902 <_sk_load_8888_sse2+0xe>
- DB 95 ; pop %edi
- DB 15,40,125,88 ; movaps 0x58(%ebp),%xmm7
- DB 15,40,117,72 ; movaps 0x48(%ebp),%xmm6
- DB 139,77,20 ; mov 0x14(%ebp),%ecx
+ DB 131,236,12 ; sub $0xc,%esp
+ DB 232,0,0,0,0 ; call 4583 <_sk_load_8888_sse2+0xe>
+ DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
- DB 139,48 ; mov (%eax),%esi
- DB 139,86,4 ; mov 0x4(%esi),%edx
- DB 15,175,209 ; imul %ecx,%edx
- DB 193,226,2 ; shl $0x2,%edx
- DB 3,22 ; add (%esi),%edx
- DB 139,93,24 ; mov 0x18(%ebp),%ebx
+ DB 139,77,8 ; mov 0x8(%ebp),%ecx
+ DB 139,56 ; mov (%eax),%edi
+ DB 139,119,4 ; mov 0x4(%edi),%esi
+ DB 15,175,113,4 ; imul 0x4(%ecx),%esi
+ DB 193,230,2 ; shl $0x2,%esi
+ DB 3,55 ; add (%edi),%esi
+ DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 133,219 ; test %ebx,%ebx
- DB 139,117,16 ; mov 0x10(%ebp),%esi
- DB 15,133,147,0,0,0 ; jne 59bf <_sk_load_8888_sse2+0xcb>
- DB 243,15,111,44,178 ; movdqu (%edx,%esi,4),%xmm5
- DB 102,15,111,151,126,70,0,0 ; movdqa 0x467e(%edi),%xmm2
- DB 102,15,111,197 ; movdqa %xmm5,%xmm0
+ DB 139,57 ; mov (%ecx),%edi
+ DB 117,102 ; jne 4607 <_sk_load_8888_sse2+0x92>
+ DB 243,15,111,28,190 ; movdqu (%esi,%edi,4),%xmm3
+ DB 102,15,111,146,29,55,0,0 ; movdqa 0x371d(%edx),%xmm2
+ DB 102,15,111,195 ; movdqa %xmm3,%xmm0
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,40,167,142,70,0,0 ; movaps 0x468e(%edi),%xmm4
+ DB 15,40,162,45,55,0,0 ; movaps 0x372d(%edx),%xmm4
DB 15,89,196 ; mulps %xmm4,%xmm0
- DB 102,15,111,205 ; movdqa %xmm5,%xmm1
+ DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,15,114,209,8 ; psrld $0x8,%xmm1
DB 102,15,219,202 ; pand %xmm2,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
DB 15,89,204 ; mulps %xmm4,%xmm1
- DB 102,15,111,221 ; movdqa %xmm5,%xmm3
- DB 102,15,114,211,16 ; psrld $0x10,%xmm3
- DB 102,15,219,218 ; pand %xmm2,%xmm3
- DB 15,91,211 ; cvtdq2ps %xmm3,%xmm2
+ DB 102,15,111,235 ; movdqa %xmm3,%xmm5
+ DB 102,15,114,213,16 ; psrld $0x10,%xmm5
+ DB 102,15,219,234 ; pand %xmm2,%xmm5
+ DB 15,91,213 ; cvtdq2ps %xmm5,%xmm2
DB 15,89,212 ; mulps %xmm4,%xmm2
- DB 102,15,114,213,24 ; psrld $0x18,%xmm5
- DB 15,91,221 ; cvtdq2ps %xmm5,%xmm3
+ DB 102,15,114,211,24 ; psrld $0x18,%xmm3
+ DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
DB 15,89,220 ; mulps %xmm4,%xmm3
DB 141,80,8 ; lea 0x8(%eax),%edx
- DB 15,41,124,36,80 ; movaps %xmm7,0x50(%esp)
- DB 15,41,116,36,64 ; movaps %xmm6,0x40(%esp)
- DB 15,40,101,56 ; movaps 0x38(%ebp),%xmm4
- DB 15,41,100,36,48 ; movaps %xmm4,0x30(%esp)
- DB 15,40,101,40 ; movaps 0x28(%ebp),%xmm4
- DB 15,41,100,36,32 ; movaps %xmm4,0x20(%esp)
- DB 137,92,36,16 ; mov %ebx,0x10(%esp)
- DB 137,76,36,12 ; mov %ecx,0xc(%esp)
- DB 137,116,36,8 ; mov %esi,0x8(%esp)
- DB 137,84,36,4 ; mov %edx,0x4(%esp)
- DB 139,77,8 ; mov 0x8(%ebp),%ecx
- DB 137,12,36 ; mov %ecx,(%esp)
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 82 ; push %edx
+ DB 81 ; push %ecx
DB 255,80,4 ; call *0x4(%eax)
- DB 131,196,108 ; add $0x6c,%esp
+ DB 131,196,28 ; add $0x1c,%esp
DB 94 ; pop %esi
DB 95 ; pop %edi
DB 91 ; pop %ebx
DB 93 ; pop %ebp
DB 195 ; ret
- DB 137,217 ; mov %ebx,%ecx
- DB 136,77,243 ; mov %cl,-0xd(%ebp)
- DB 128,101,243,3 ; andb $0x3,-0xd(%ebp)
- DB 128,125,243,1 ; cmpb $0x1,-0xd(%ebp)
- DB 116,44 ; je 59fa <_sk_load_8888_sse2+0x106>
- DB 102,15,239,237 ; pxor %xmm5,%xmm5
- DB 128,125,243,2 ; cmpb $0x2,-0xd(%ebp)
- DB 139,77,20 ; mov 0x14(%ebp),%ecx
- DB 116,21 ; je 59f0 <_sk_load_8888_sse2+0xfc>
- DB 128,125,243,3 ; cmpb $0x3,-0xd(%ebp)
- DB 15,133,76,255,255,255 ; jne 5931 <_sk_load_8888_sse2+0x3d>
- DB 102,15,110,68,178,8 ; movd 0x8(%edx,%esi,4),%xmm0
- DB 102,15,112,232,69 ; pshufd $0x45,%xmm0,%xmm5
- DB 102,15,18,44,178 ; movlpd (%edx,%esi,4),%xmm5
- DB 233,55,255,255,255 ; jmp 5931 <_sk_load_8888_sse2+0x3d>
- DB 102,15,110,44,178 ; movd (%edx,%esi,4),%xmm5
- DB 139,77,20 ; mov 0x14(%ebp),%ecx
- DB 233,42,255,255,255 ; jmp 5931 <_sk_load_8888_sse2+0x3d>
+ DB 128,227,3 ; and $0x3,%bl
+ DB 128,251,1 ; cmp $0x1,%bl
+ DB 116,35 ; je 4632 <_sk_load_8888_sse2+0xbd>
+ DB 102,15,239,219 ; pxor %xmm3,%xmm3
+ DB 128,251,2 ; cmp $0x2,%bl
+ DB 116,16 ; je 4628 <_sk_load_8888_sse2+0xb3>
+ DB 128,251,3 ; cmp $0x3,%bl
+ DB 117,137 ; jne 45a6 <_sk_load_8888_sse2+0x31>
+ DB 102,15,110,68,190,8 ; movd 0x8(%esi,%edi,4),%xmm0
+ DB 102,15,112,216,69 ; pshufd $0x45,%xmm0,%xmm3
+ DB 102,15,18,28,190 ; movlpd (%esi,%edi,4),%xmm3
+ DB 233,116,255,255,255 ; jmp 45a6 <_sk_load_8888_sse2+0x31>
+ DB 102,15,110,28,190 ; movd (%esi,%edi,4),%xmm3
+ DB 233,106,255,255,255 ; jmp 45a6 <_sk_load_8888_sse2+0x31>
PUBLIC _sk_load_8888_dst_sse2
_sk_load_8888_dst_sse2 LABEL PROC
@@ -43226,97 +41818,80 @@ _sk_load_8888_dst_sse2 LABEL PROC
DB 83 ; push %ebx
DB 87 ; push %edi
DB 86 ; push %esi
- DB 129,236,140,0,0,0 ; sub $0x8c,%esp
- DB 102,15,127,93,200 ; movdqa %xmm3,-0x38(%ebp)
- DB 15,41,85,216 ; movaps %xmm2,-0x28(%ebp)
- DB 232,0,0,0,0 ; call 5a21 <_sk_load_8888_dst_sse2+0x1a>
- DB 95 ; pop %edi
- DB 139,77,20 ; mov 0x14(%ebp),%ecx
+ DB 131,236,12 ; sub $0xc,%esp
+ DB 232,0,0,0,0 ; call 464a <_sk_load_8888_dst_sse2+0xe>
+ DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
- DB 139,48 ; mov (%eax),%esi
- DB 139,86,4 ; mov 0x4(%esi),%edx
- DB 15,175,209 ; imul %ecx,%edx
- DB 193,226,2 ; shl $0x2,%edx
- DB 3,22 ; add (%esi),%edx
- DB 139,93,24 ; mov 0x18(%ebp),%ebx
+ DB 139,77,8 ; mov 0x8(%ebp),%ecx
+ DB 139,56 ; mov (%eax),%edi
+ DB 139,119,4 ; mov 0x4(%edi),%esi
+ DB 15,175,113,4 ; imul 0x4(%ecx),%esi
+ DB 193,230,2 ; shl $0x2,%esi
+ DB 3,55 ; add (%edi),%esi
+ DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 133,219 ; test %ebx,%ebx
- DB 139,117,16 ; mov 0x10(%ebp),%esi
- DB 15,133,150,0,0,0 ; jne 5ad9 <_sk_load_8888_dst_sse2+0xd2>
- DB 243,15,111,28,178 ; movdqu (%edx,%esi,4),%xmm3
- DB 102,15,111,151,127,69,0,0 ; movdqa 0x457f(%edi),%xmm2
- DB 102,15,111,243 ; movdqa %xmm3,%xmm6
- DB 102,15,219,242 ; pand %xmm2,%xmm6
+ DB 139,57 ; mov (%ecx),%edi
+ DB 117,118 ; jne 46de <_sk_load_8888_dst_sse2+0xa2>
+ DB 243,15,111,36,190 ; movdqu (%esi,%edi,4),%xmm4
+ DB 102,15,111,170,118,54,0,0 ; movdqa 0x3676(%edx),%xmm5
+ DB 102,15,111,244 ; movdqa %xmm4,%xmm6
+ DB 102,15,219,245 ; pand %xmm5,%xmm6
DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
- DB 15,40,191,143,69,0,0 ; movaps 0x458f(%edi),%xmm7
+ DB 15,40,186,134,54,0,0 ; movaps 0x3686(%edx),%xmm7
DB 15,89,247 ; mulps %xmm7,%xmm6
- DB 102,15,111,227 ; movdqa %xmm3,%xmm4
- DB 102,15,114,212,8 ; psrld $0x8,%xmm4
- DB 102,15,219,226 ; pand %xmm2,%xmm4
+ DB 15,41,113,16 ; movaps %xmm6,0x10(%ecx)
+ DB 102,15,111,244 ; movdqa %xmm4,%xmm6
+ DB 102,15,114,214,8 ; psrld $0x8,%xmm6
+ DB 102,15,219,245 ; pand %xmm5,%xmm6
+ DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
+ DB 15,89,247 ; mulps %xmm7,%xmm6
+ DB 15,41,113,32 ; movaps %xmm6,0x20(%ecx)
+ DB 102,15,111,244 ; movdqa %xmm4,%xmm6
+ DB 102,15,114,214,16 ; psrld $0x10,%xmm6
+ DB 102,15,219,245 ; pand %xmm5,%xmm6
+ DB 15,91,238 ; cvtdq2ps %xmm6,%xmm5
+ DB 15,89,239 ; mulps %xmm7,%xmm5
+ DB 15,41,105,48 ; movaps %xmm5,0x30(%ecx)
+ DB 102,15,114,212,24 ; psrld $0x18,%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
DB 15,89,231 ; mulps %xmm7,%xmm4
- DB 102,15,111,235 ; movdqa %xmm3,%xmm5
- DB 102,15,114,213,16 ; psrld $0x10,%xmm5
- DB 102,15,219,234 ; pand %xmm2,%xmm5
- DB 15,91,213 ; cvtdq2ps %xmm5,%xmm2
- DB 15,89,215 ; mulps %xmm7,%xmm2
- DB 102,15,114,211,24 ; psrld $0x18,%xmm3
- DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,223 ; mulps %xmm7,%xmm3
+ DB 15,41,97,64 ; movaps %xmm4,0x40(%ecx)
DB 141,80,8 ; lea 0x8(%eax),%edx
- DB 137,92,36,16 ; mov %ebx,0x10(%esp)
- DB 137,76,36,12 ; mov %ecx,0xc(%esp)
- DB 137,116,36,8 ; mov %esi,0x8(%esp)
- DB 137,84,36,4 ; mov %edx,0x4(%esp)
- DB 139,77,8 ; mov 0x8(%ebp),%ecx
- DB 137,12,36 ; mov %ecx,(%esp)
- DB 15,41,92,36,80 ; movaps %xmm3,0x50(%esp)
- DB 15,41,116,36,32 ; movaps %xmm6,0x20(%esp)
- DB 15,41,84,36,64 ; movaps %xmm2,0x40(%esp)
- DB 15,41,100,36,48 ; movaps %xmm4,0x30(%esp)
- DB 15,40,85,216 ; movaps -0x28(%ebp),%xmm2
- DB 15,40,93,200 ; movaps -0x38(%ebp),%xmm3
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 82 ; push %edx
+ DB 81 ; push %ecx
DB 255,80,4 ; call *0x4(%eax)
- DB 129,196,140,0,0,0 ; add $0x8c,%esp
+ DB 131,196,28 ; add $0x1c,%esp
DB 94 ; pop %esi
DB 95 ; pop %edi
DB 91 ; pop %ebx
DB 93 ; pop %ebp
DB 195 ; ret
- DB 137,217 ; mov %ebx,%ecx
- DB 136,77,243 ; mov %cl,-0xd(%ebp)
- DB 128,101,243,3 ; andb $0x3,-0xd(%ebp)
- DB 128,125,243,1 ; cmpb $0x1,-0xd(%ebp)
- DB 116,44 ; je 5b14 <_sk_load_8888_dst_sse2+0x10d>
- DB 102,15,239,219 ; pxor %xmm3,%xmm3
- DB 128,125,243,2 ; cmpb $0x2,-0xd(%ebp)
- DB 139,77,20 ; mov 0x14(%ebp),%ecx
- DB 116,21 ; je 5b0a <_sk_load_8888_dst_sse2+0x103>
- DB 128,125,243,3 ; cmpb $0x3,-0xd(%ebp)
- DB 15,133,73,255,255,255 ; jne 5a48 <_sk_load_8888_dst_sse2+0x41>
- DB 102,15,110,100,178,8 ; movd 0x8(%edx,%esi,4),%xmm4
- DB 102,15,112,220,69 ; pshufd $0x45,%xmm4,%xmm3
- DB 102,15,18,28,178 ; movlpd (%edx,%esi,4),%xmm3
- DB 233,52,255,255,255 ; jmp 5a48 <_sk_load_8888_dst_sse2+0x41>
- DB 102,15,110,28,178 ; movd (%edx,%esi,4),%xmm3
- DB 139,77,20 ; mov 0x14(%ebp),%ecx
- DB 233,39,255,255,255 ; jmp 5a48 <_sk_load_8888_dst_sse2+0x41>
+ DB 128,227,3 ; and $0x3,%bl
+ DB 128,251,1 ; cmp $0x1,%bl
+ DB 116,39 ; je 470d <_sk_load_8888_dst_sse2+0xd1>
+ DB 102,15,239,228 ; pxor %xmm4,%xmm4
+ DB 128,251,2 ; cmp $0x2,%bl
+ DB 116,20 ; je 4703 <_sk_load_8888_dst_sse2+0xc7>
+ DB 128,251,3 ; cmp $0x3,%bl
+ DB 15,133,117,255,255,255 ; jne 466d <_sk_load_8888_dst_sse2+0x31>
+ DB 102,15,110,100,190,8 ; movd 0x8(%esi,%edi,4),%xmm4
+ DB 102,15,112,228,69 ; pshufd $0x45,%xmm4,%xmm4
+ DB 102,15,18,36,190 ; movlpd (%esi,%edi,4),%xmm4
+ DB 233,96,255,255,255 ; jmp 466d <_sk_load_8888_dst_sse2+0x31>
+ DB 102,15,110,36,190 ; movd (%esi,%edi,4),%xmm4
+ DB 233,86,255,255,255 ; jmp 466d <_sk_load_8888_dst_sse2+0x31>
PUBLIC _sk_gather_8888_sse2
_sk_gather_8888_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 232,0,0,0,0 ; call 5b2f <_sk_gather_8888_sse2+0xe>
- DB 90 ; pop %edx
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,77,12 ; mov 0xc(%ebp),%ecx
- DB 139,49 ; mov (%ecx),%esi
- DB 139,62 ; mov (%esi),%edi
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 139,69,12 ; mov 0xc(%ebp),%eax
+ DB 139,8 ; mov (%eax),%ecx
+ DB 139,17 ; mov (%ecx),%edx
DB 243,15,91,201 ; cvttps2dq %xmm1,%xmm1
- DB 102,15,110,86,4 ; movd 0x4(%esi),%xmm2
+ DB 102,15,110,81,4 ; movd 0x4(%ecx),%xmm2
DB 102,15,112,210,0 ; pshufd $0x0,%xmm2,%xmm2
DB 102,15,112,217,245 ; pshufd $0xf5,%xmm1,%xmm3
DB 102,15,244,218 ; pmuludq %xmm2,%xmm3
@@ -43328,59 +41903,45 @@ _sk_gather_8888_sse2 LABEL PROC
DB 102,15,254,193 ; paddd %xmm1,%xmm0
DB 102,15,112,200,229 ; pshufd $0xe5,%xmm0,%xmm1
DB 102,15,112,208,231 ; pshufd $0xe7,%xmm0,%xmm2
- DB 102,15,126,214 ; movd %xmm2,%esi
- DB 102,15,110,20,183 ; movd (%edi,%esi,4),%xmm2
- DB 102,15,126,206 ; movd %xmm1,%esi
- DB 102,15,110,12,183 ; movd (%edi,%esi,4),%xmm1
- DB 102,15,126,198 ; movd %xmm0,%esi
+ DB 102,15,126,209 ; movd %xmm2,%ecx
+ DB 102,15,110,20,138 ; movd (%edx,%ecx,4),%xmm2
+ DB 102,15,126,201 ; movd %xmm1,%ecx
+ DB 102,15,110,12,138 ; movd (%edx,%ecx,4),%xmm1
+ DB 102,15,126,193 ; movd %xmm0,%ecx
DB 102,15,112,192,78 ; pshufd $0x4e,%xmm0,%xmm0
- DB 102,15,110,28,183 ; movd (%edi,%esi,4),%xmm3
- DB 102,15,126,198 ; movd %xmm0,%esi
- DB 102,15,110,4,183 ; movd (%edi,%esi,4),%xmm0
- DB 139,117,16 ; mov 0x10(%ebp),%esi
- DB 139,125,20 ; mov 0x14(%ebp),%edi
- DB 102,15,111,162,145,68,0,0 ; movdqa 0x4491(%edx),%xmm4
- DB 15,40,170,161,68,0,0 ; movaps 0x44a1(%edx),%xmm5
- DB 139,85,24 ; mov 0x18(%ebp),%edx
- DB 15,40,117,40 ; movaps 0x28(%ebp),%xmm6
- DB 15,40,125,56 ; movaps 0x38(%ebp),%xmm7
+ DB 102,15,110,28,138 ; movd (%edx,%ecx,4),%xmm3
+ DB 102,15,126,193 ; movd %xmm0,%ecx
+ DB 102,15,110,4,138 ; movd (%edx,%ecx,4),%xmm0
+ DB 232,0,0,0,0 ; call 478d <_sk_gather_8888_sse2+0x76>
+ DB 89 ; pop %ecx
DB 102,15,98,202 ; punpckldq %xmm2,%xmm1
DB 102,15,98,216 ; punpckldq %xmm0,%xmm3
DB 102,15,98,217 ; punpckldq %xmm1,%xmm3
+ DB 102,15,111,145,83,53,0,0 ; movdqa 0x3553(%ecx),%xmm2
DB 102,15,111,195 ; movdqa %xmm3,%xmm0
- DB 102,15,219,196 ; pand %xmm4,%xmm0
+ DB 102,15,219,194 ; pand %xmm2,%xmm0
+ DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
+ DB 15,40,161,99,53,0,0 ; movaps 0x3563(%ecx),%xmm4
+ DB 15,89,196 ; mulps %xmm4,%xmm0
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,15,114,209,8 ; psrld $0x8,%xmm1
- DB 102,15,219,204 ; pand %xmm4,%xmm1
- DB 102,15,111,211 ; movdqa %xmm3,%xmm2
- DB 102,15,114,210,16 ; psrld $0x10,%xmm2
- DB 102,15,219,212 ; pand %xmm4,%xmm2
- DB 15,40,101,72 ; movaps 0x48(%ebp),%xmm4
- DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,197 ; mulps %xmm5,%xmm0
+ DB 102,15,219,202 ; pand %xmm2,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,205 ; mulps %xmm5,%xmm1
- DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,213 ; mulps %xmm5,%xmm2
+ DB 15,89,204 ; mulps %xmm4,%xmm1
+ DB 102,15,111,235 ; movdqa %xmm3,%xmm5
+ DB 102,15,114,213,16 ; psrld $0x10,%xmm5
+ DB 102,15,219,234 ; pand %xmm2,%xmm5
+ DB 15,91,213 ; cvtdq2ps %xmm5,%xmm2
+ DB 15,89,212 ; mulps %xmm4,%xmm2
DB 102,15,114,211,24 ; psrld $0x18,%xmm3
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,221 ; mulps %xmm5,%xmm3
- DB 15,40,109,88 ; movaps 0x58(%ebp),%xmm5
- DB 141,89,8 ; lea 0x8(%ecx),%ebx
- DB 15,41,108,36,80 ; movaps %xmm5,0x50(%esp)
- DB 15,41,100,36,64 ; movaps %xmm4,0x40(%esp)
- DB 15,41,124,36,48 ; movaps %xmm7,0x30(%esp)
- DB 15,41,116,36,32 ; movaps %xmm6,0x20(%esp)
- DB 137,84,36,16 ; mov %edx,0x10(%esp)
- DB 137,124,36,12 ; mov %edi,0xc(%esp)
- DB 137,116,36,8 ; mov %esi,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
- DB 255,81,4 ; call *0x4(%ecx)
- DB 131,196,108 ; add $0x6c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 15,89,220 ; mulps %xmm4,%xmm3
+ DB 141,72,8 ; lea 0x8(%eax),%ecx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 81 ; push %ecx
+ DB 255,117,8 ; pushl 0x8(%ebp)
+ DB 255,80,4 ; call *0x4(%eax)
+ DB 131,196,24 ; add $0x18,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -43391,10 +41952,19 @@ _sk_store_8888_sse2 LABEL PROC
DB 83 ; push %ebx
DB 87 ; push %edi
DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 232,0,0,0,0 ; call 5c54 <_sk_store_8888_sse2+0xe>
- DB 88 ; pop %eax
- DB 15,40,160,140,67,0,0 ; movaps 0x438c(%eax),%xmm4
+ DB 131,236,12 ; sub $0xc,%esp
+ DB 232,0,0,0,0 ; call 4808 <_sk_store_8888_sse2+0xe>
+ DB 95 ; pop %edi
+ DB 139,69,12 ; mov 0xc(%ebp),%eax
+ DB 139,77,8 ; mov 0x8(%ebp),%ecx
+ DB 139,48 ; mov (%eax),%esi
+ DB 139,86,4 ; mov 0x4(%esi),%edx
+ DB 15,175,81,4 ; imul 0x4(%ecx),%edx
+ DB 193,226,2 ; shl $0x2,%edx
+ DB 3,22 ; add (%esi),%edx
+ DB 139,49 ; mov (%ecx),%esi
+ DB 15,40,167,248,52,0,0 ; movaps 0x34f8(%edi),%xmm4
+ DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 15,40,232 ; movaps %xmm0,%xmm5
DB 15,89,236 ; mulps %xmm4,%xmm5
DB 102,15,91,237 ; cvtps2dq %xmm5,%xmm5
@@ -43408,61 +41978,37 @@ _sk_store_8888_sse2 LABEL PROC
DB 102,15,91,237 ; cvtps2dq %xmm5,%xmm5
DB 102,15,114,245,16 ; pslld $0x10,%xmm5
DB 15,89,227 ; mulps %xmm3,%xmm4
- DB 102,15,91,252 ; cvtps2dq %xmm4,%xmm7
- DB 102,15,114,247,24 ; pslld $0x18,%xmm7
- DB 102,15,235,253 ; por %xmm5,%xmm7
- DB 102,15,235,254 ; por %xmm6,%xmm7
- DB 15,40,117,56 ; movaps 0x38(%ebp),%xmm6
- DB 139,85,24 ; mov 0x18(%ebp),%edx
- DB 139,77,20 ; mov 0x14(%ebp),%ecx
- DB 139,69,12 ; mov 0xc(%ebp),%eax
- DB 139,48 ; mov (%eax),%esi
- DB 139,94,4 ; mov 0x4(%esi),%ebx
- DB 15,175,217 ; imul %ecx,%ebx
- DB 193,227,2 ; shl $0x2,%ebx
- DB 3,30 ; add (%esi),%ebx
- DB 139,125,16 ; mov 0x10(%ebp),%edi
- DB 133,210 ; test %edx,%edx
- DB 139,117,8 ; mov 0x8(%ebp),%esi
- DB 15,40,101,40 ; movaps 0x28(%ebp),%xmm4
- DB 117,66 ; jne 5d06 <_sk_store_8888_sse2+0xc0>
- DB 243,15,127,60,187 ; movdqu %xmm7,(%ebx,%edi,4)
- DB 141,88,8 ; lea 0x8(%eax),%ebx
- DB 15,40,109,88 ; movaps 0x58(%ebp),%xmm5
- DB 15,41,108,36,80 ; movaps %xmm5,0x50(%esp)
- DB 15,40,109,72 ; movaps 0x48(%ebp),%xmm5
- DB 15,41,108,36,64 ; movaps %xmm5,0x40(%esp)
- DB 15,41,116,36,48 ; movaps %xmm6,0x30(%esp)
- DB 15,41,100,36,32 ; movaps %xmm4,0x20(%esp)
- DB 137,84,36,16 ; mov %edx,0x10(%esp)
- DB 137,76,36,12 ; mov %ecx,0xc(%esp)
- DB 137,124,36,8 ; mov %edi,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,52,36 ; mov %esi,(%esp)
+ DB 102,15,91,228 ; cvtps2dq %xmm4,%xmm4
+ DB 102,15,114,244,24 ; pslld $0x18,%xmm4
+ DB 102,15,235,229 ; por %xmm5,%xmm4
+ DB 102,15,235,230 ; por %xmm6,%xmm4
+ DB 133,219 ; test %ebx,%ebx
+ DB 117,24 ; jne 4885 <_sk_store_8888_sse2+0x8b>
+ DB 243,15,127,36,178 ; movdqu %xmm4,(%edx,%esi,4)
+ DB 141,80,8 ; lea 0x8(%eax),%edx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 82 ; push %edx
+ DB 81 ; push %ecx
DB 255,80,4 ; call *0x4(%eax)
- DB 131,196,108 ; add $0x6c,%esp
+ DB 131,196,28 ; add $0x1c,%esp
DB 94 ; pop %esi
DB 95 ; pop %edi
DB 91 ; pop %ebx
DB 93 ; pop %ebp
DB 195 ; ret
- DB 137,209 ; mov %edx,%ecx
- DB 136,77,243 ; mov %cl,-0xd(%ebp)
- DB 128,101,243,3 ; andb $0x3,-0xd(%ebp)
- DB 128,125,243,1 ; cmpb $0x1,-0xd(%ebp)
- DB 116,33 ; je 5d36 <_sk_store_8888_sse2+0xf0>
- DB 128,125,243,2 ; cmpb $0x2,-0xd(%ebp)
- DB 139,77,20 ; mov 0x14(%ebp),%ecx
- DB 116,17 ; je 5d2f <_sk_store_8888_sse2+0xe9>
- DB 128,125,243,3 ; cmpb $0x3,-0xd(%ebp)
- DB 117,165 ; jne 5cc9 <_sk_store_8888_sse2+0x83>
- DB 102,15,112,239,78 ; pshufd $0x4e,%xmm7,%xmm5
- DB 102,15,126,108,187,8 ; movd %xmm5,0x8(%ebx,%edi,4)
- DB 102,15,214,60,187 ; movq %xmm7,(%ebx,%edi,4)
- DB 235,147 ; jmp 5cc9 <_sk_store_8888_sse2+0x83>
- DB 102,15,126,60,187 ; movd %xmm7,(%ebx,%edi,4)
- DB 139,77,20 ; mov 0x14(%ebp),%ecx
- DB 235,137 ; jmp 5cc9 <_sk_store_8888_sse2+0x83>
+ DB 128,227,3 ; and $0x3,%bl
+ DB 128,251,1 ; cmp $0x1,%bl
+ DB 116,28 ; je 48a9 <_sk_store_8888_sse2+0xaf>
+ DB 128,251,2 ; cmp $0x2,%bl
+ DB 116,16 ; je 48a2 <_sk_store_8888_sse2+0xa8>
+ DB 128,251,3 ; cmp $0x3,%bl
+ DB 117,219 ; jne 4872 <_sk_store_8888_sse2+0x78>
+ DB 102,15,112,236,78 ; pshufd $0x4e,%xmm4,%xmm5
+ DB 102,15,126,108,178,8 ; movd %xmm5,0x8(%edx,%esi,4)
+ DB 102,15,214,36,178 ; movq %xmm4,(%edx,%esi,4)
+ DB 235,201 ; jmp 4872 <_sk_store_8888_sse2+0x78>
+ DB 102,15,126,36,178 ; movd %xmm4,(%edx,%esi,4)
+ DB 235,194 ; jmp 4872 <_sk_store_8888_sse2+0x78>
PUBLIC _sk_load_bgra_sse2
_sk_load_bgra_sse2 LABEL PROC
@@ -43471,80 +42017,65 @@ _sk_load_bgra_sse2 LABEL PROC
DB 83 ; push %ebx
DB 87 ; push %edi
DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 232,0,0,0,0 ; call 5d4e <_sk_load_bgra_sse2+0xe>
- DB 95 ; pop %edi
- DB 15,40,125,88 ; movaps 0x58(%ebp),%xmm7
- DB 15,40,117,72 ; movaps 0x48(%ebp),%xmm6
- DB 139,77,20 ; mov 0x14(%ebp),%ecx
+ DB 131,236,12 ; sub $0xc,%esp
+ DB 232,0,0,0,0 ; call 48be <_sk_load_bgra_sse2+0xe>
+ DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
- DB 139,48 ; mov (%eax),%esi
- DB 139,86,4 ; mov 0x4(%esi),%edx
- DB 15,175,209 ; imul %ecx,%edx
- DB 193,226,2 ; shl $0x2,%edx
- DB 3,22 ; add (%esi),%edx
- DB 139,93,24 ; mov 0x18(%ebp),%ebx
+ DB 139,77,8 ; mov 0x8(%ebp),%ecx
+ DB 139,56 ; mov (%eax),%edi
+ DB 139,119,4 ; mov 0x4(%edi),%esi
+ DB 15,175,113,4 ; imul 0x4(%ecx),%esi
+ DB 193,230,2 ; shl $0x2,%esi
+ DB 3,55 ; add (%edi),%esi
+ DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 133,219 ; test %ebx,%ebx
- DB 139,117,16 ; mov 0x10(%ebp),%esi
- DB 15,133,147,0,0,0 ; jne 5e0b <_sk_load_bgra_sse2+0xcb>
- DB 243,15,111,44,178 ; movdqu (%edx,%esi,4),%xmm5
- DB 102,15,111,135,162,66,0,0 ; movdqa 0x42a2(%edi),%xmm0
- DB 102,15,111,205 ; movdqa %xmm5,%xmm1
+ DB 139,57 ; mov (%ecx),%edi
+ DB 117,102 ; jne 4942 <_sk_load_bgra_sse2+0x92>
+ DB 243,15,111,28,190 ; movdqu (%esi,%edi,4),%xmm3
+ DB 102,15,111,130,82,52,0,0 ; movdqa 0x3452(%edx),%xmm0
+ DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,15,219,200 ; pand %xmm0,%xmm1
DB 15,91,209 ; cvtdq2ps %xmm1,%xmm2
- DB 15,40,167,178,66,0,0 ; movaps 0x42b2(%edi),%xmm4
+ DB 15,40,162,98,52,0,0 ; movaps 0x3462(%edx),%xmm4
DB 15,89,212 ; mulps %xmm4,%xmm2
- DB 102,15,111,205 ; movdqa %xmm5,%xmm1
+ DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,15,114,209,8 ; psrld $0x8,%xmm1
DB 102,15,219,200 ; pand %xmm0,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
DB 15,89,204 ; mulps %xmm4,%xmm1
- DB 102,15,111,221 ; movdqa %xmm5,%xmm3
- DB 102,15,114,211,16 ; psrld $0x10,%xmm3
- DB 102,15,219,216 ; pand %xmm0,%xmm3
- DB 15,91,195 ; cvtdq2ps %xmm3,%xmm0
+ DB 102,15,111,235 ; movdqa %xmm3,%xmm5
+ DB 102,15,114,213,16 ; psrld $0x10,%xmm5
+ DB 102,15,219,232 ; pand %xmm0,%xmm5
+ DB 15,91,197 ; cvtdq2ps %xmm5,%xmm0
DB 15,89,196 ; mulps %xmm4,%xmm0
- DB 102,15,114,213,24 ; psrld $0x18,%xmm5
- DB 15,91,221 ; cvtdq2ps %xmm5,%xmm3
+ DB 102,15,114,211,24 ; psrld $0x18,%xmm3
+ DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
DB 15,89,220 ; mulps %xmm4,%xmm3
DB 141,80,8 ; lea 0x8(%eax),%edx
- DB 15,41,124,36,80 ; movaps %xmm7,0x50(%esp)
- DB 15,41,116,36,64 ; movaps %xmm6,0x40(%esp)
- DB 15,40,101,56 ; movaps 0x38(%ebp),%xmm4
- DB 15,41,100,36,48 ; movaps %xmm4,0x30(%esp)
- DB 15,40,101,40 ; movaps 0x28(%ebp),%xmm4
- DB 15,41,100,36,32 ; movaps %xmm4,0x20(%esp)
- DB 137,92,36,16 ; mov %ebx,0x10(%esp)
- DB 137,76,36,12 ; mov %ecx,0xc(%esp)
- DB 137,116,36,8 ; mov %esi,0x8(%esp)
- DB 137,84,36,4 ; mov %edx,0x4(%esp)
- DB 139,77,8 ; mov 0x8(%ebp),%ecx
- DB 137,12,36 ; mov %ecx,(%esp)
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 82 ; push %edx
+ DB 81 ; push %ecx
DB 255,80,4 ; call *0x4(%eax)
- DB 131,196,108 ; add $0x6c,%esp
+ DB 131,196,28 ; add $0x1c,%esp
DB 94 ; pop %esi
DB 95 ; pop %edi
DB 91 ; pop %ebx
DB 93 ; pop %ebp
DB 195 ; ret
- DB 137,217 ; mov %ebx,%ecx
- DB 136,77,243 ; mov %cl,-0xd(%ebp)
- DB 128,101,243,3 ; andb $0x3,-0xd(%ebp)
- DB 128,125,243,1 ; cmpb $0x1,-0xd(%ebp)
- DB 116,44 ; je 5e46 <_sk_load_bgra_sse2+0x106>
- DB 102,15,239,237 ; pxor %xmm5,%xmm5
- DB 128,125,243,2 ; cmpb $0x2,-0xd(%ebp)
- DB 139,77,20 ; mov 0x14(%ebp),%ecx
- DB 116,21 ; je 5e3c <_sk_load_bgra_sse2+0xfc>
- DB 128,125,243,3 ; cmpb $0x3,-0xd(%ebp)
- DB 15,133,76,255,255,255 ; jne 5d7d <_sk_load_bgra_sse2+0x3d>
- DB 102,15,110,68,178,8 ; movd 0x8(%edx,%esi,4),%xmm0
- DB 102,15,112,232,69 ; pshufd $0x45,%xmm0,%xmm5
- DB 102,15,18,44,178 ; movlpd (%edx,%esi,4),%xmm5
- DB 233,55,255,255,255 ; jmp 5d7d <_sk_load_bgra_sse2+0x3d>
- DB 102,15,110,44,178 ; movd (%edx,%esi,4),%xmm5
- DB 139,77,20 ; mov 0x14(%ebp),%ecx
- DB 233,42,255,255,255 ; jmp 5d7d <_sk_load_bgra_sse2+0x3d>
+ DB 128,227,3 ; and $0x3,%bl
+ DB 128,251,1 ; cmp $0x1,%bl
+ DB 116,35 ; je 496d <_sk_load_bgra_sse2+0xbd>
+ DB 102,15,239,219 ; pxor %xmm3,%xmm3
+ DB 128,251,2 ; cmp $0x2,%bl
+ DB 116,16 ; je 4963 <_sk_load_bgra_sse2+0xb3>
+ DB 128,251,3 ; cmp $0x3,%bl
+ DB 117,137 ; jne 48e1 <_sk_load_bgra_sse2+0x31>
+ DB 102,15,110,68,190,8 ; movd 0x8(%esi,%edi,4),%xmm0
+ DB 102,15,112,216,69 ; pshufd $0x45,%xmm0,%xmm3
+ DB 102,15,18,28,190 ; movlpd (%esi,%edi,4),%xmm3
+ DB 233,116,255,255,255 ; jmp 48e1 <_sk_load_bgra_sse2+0x31>
+ DB 102,15,110,28,190 ; movd (%esi,%edi,4),%xmm3
+ DB 233,106,255,255,255 ; jmp 48e1 <_sk_load_bgra_sse2+0x31>
PUBLIC _sk_load_bgra_dst_sse2
_sk_load_bgra_dst_sse2 LABEL PROC
@@ -43553,97 +42084,80 @@ _sk_load_bgra_dst_sse2 LABEL PROC
DB 83 ; push %ebx
DB 87 ; push %edi
DB 86 ; push %esi
- DB 129,236,140,0,0,0 ; sub $0x8c,%esp
- DB 102,15,127,93,200 ; movdqa %xmm3,-0x38(%ebp)
- DB 15,41,85,216 ; movaps %xmm2,-0x28(%ebp)
- DB 232,0,0,0,0 ; call 5e6d <_sk_load_bgra_dst_sse2+0x1a>
- DB 95 ; pop %edi
- DB 139,77,20 ; mov 0x14(%ebp),%ecx
+ DB 131,236,12 ; sub $0xc,%esp
+ DB 232,0,0,0,0 ; call 4985 <_sk_load_bgra_dst_sse2+0xe>
+ DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
- DB 139,48 ; mov (%eax),%esi
- DB 139,86,4 ; mov 0x4(%esi),%edx
- DB 15,175,209 ; imul %ecx,%edx
- DB 193,226,2 ; shl $0x2,%edx
- DB 3,22 ; add (%esi),%edx
- DB 139,93,24 ; mov 0x18(%ebp),%ebx
+ DB 139,77,8 ; mov 0x8(%ebp),%ecx
+ DB 139,56 ; mov (%eax),%edi
+ DB 139,119,4 ; mov 0x4(%edi),%esi
+ DB 15,175,113,4 ; imul 0x4(%ecx),%esi
+ DB 193,230,2 ; shl $0x2,%esi
+ DB 3,55 ; add (%edi),%esi
+ DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 133,219 ; test %ebx,%ebx
- DB 139,117,16 ; mov 0x10(%ebp),%esi
- DB 15,133,150,0,0,0 ; jne 5f25 <_sk_load_bgra_dst_sse2+0xd2>
- DB 243,15,111,28,178 ; movdqu (%edx,%esi,4),%xmm3
- DB 102,15,111,151,163,65,0,0 ; movdqa 0x41a3(%edi),%xmm2
- DB 102,15,111,243 ; movdqa %xmm3,%xmm6
- DB 102,15,219,242 ; pand %xmm2,%xmm6
+ DB 139,57 ; mov (%ecx),%edi
+ DB 117,118 ; jne 4a19 <_sk_load_bgra_dst_sse2+0xa2>
+ DB 243,15,111,36,190 ; movdqu (%esi,%edi,4),%xmm4
+ DB 102,15,111,170,171,51,0,0 ; movdqa 0x33ab(%edx),%xmm5
+ DB 102,15,111,244 ; movdqa %xmm4,%xmm6
+ DB 102,15,219,245 ; pand %xmm5,%xmm6
DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
- DB 15,40,191,179,65,0,0 ; movaps 0x41b3(%edi),%xmm7
+ DB 15,40,186,187,51,0,0 ; movaps 0x33bb(%edx),%xmm7
DB 15,89,247 ; mulps %xmm7,%xmm6
- DB 102,15,111,227 ; movdqa %xmm3,%xmm4
- DB 102,15,114,212,8 ; psrld $0x8,%xmm4
- DB 102,15,219,226 ; pand %xmm2,%xmm4
+ DB 15,41,113,48 ; movaps %xmm6,0x30(%ecx)
+ DB 102,15,111,244 ; movdqa %xmm4,%xmm6
+ DB 102,15,114,214,8 ; psrld $0x8,%xmm6
+ DB 102,15,219,245 ; pand %xmm5,%xmm6
+ DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
+ DB 15,89,247 ; mulps %xmm7,%xmm6
+ DB 15,41,113,32 ; movaps %xmm6,0x20(%ecx)
+ DB 102,15,111,244 ; movdqa %xmm4,%xmm6
+ DB 102,15,114,214,16 ; psrld $0x10,%xmm6
+ DB 102,15,219,245 ; pand %xmm5,%xmm6
+ DB 15,91,238 ; cvtdq2ps %xmm6,%xmm5
+ DB 15,89,239 ; mulps %xmm7,%xmm5
+ DB 15,41,105,16 ; movaps %xmm5,0x10(%ecx)
+ DB 102,15,114,212,24 ; psrld $0x18,%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
DB 15,89,231 ; mulps %xmm7,%xmm4
- DB 102,15,111,235 ; movdqa %xmm3,%xmm5
- DB 102,15,114,213,16 ; psrld $0x10,%xmm5
- DB 102,15,219,234 ; pand %xmm2,%xmm5
- DB 15,91,213 ; cvtdq2ps %xmm5,%xmm2
- DB 15,89,215 ; mulps %xmm7,%xmm2
- DB 102,15,114,211,24 ; psrld $0x18,%xmm3
- DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,223 ; mulps %xmm7,%xmm3
+ DB 15,41,97,64 ; movaps %xmm4,0x40(%ecx)
DB 141,80,8 ; lea 0x8(%eax),%edx
- DB 137,92,36,16 ; mov %ebx,0x10(%esp)
- DB 137,76,36,12 ; mov %ecx,0xc(%esp)
- DB 137,116,36,8 ; mov %esi,0x8(%esp)
- DB 137,84,36,4 ; mov %edx,0x4(%esp)
- DB 139,77,8 ; mov 0x8(%ebp),%ecx
- DB 137,12,36 ; mov %ecx,(%esp)
- DB 15,41,92,36,80 ; movaps %xmm3,0x50(%esp)
- DB 15,41,116,36,64 ; movaps %xmm6,0x40(%esp)
- DB 15,41,100,36,48 ; movaps %xmm4,0x30(%esp)
- DB 15,41,84,36,32 ; movaps %xmm2,0x20(%esp)
- DB 15,40,85,216 ; movaps -0x28(%ebp),%xmm2
- DB 15,40,93,200 ; movaps -0x38(%ebp),%xmm3
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 82 ; push %edx
+ DB 81 ; push %ecx
DB 255,80,4 ; call *0x4(%eax)
- DB 129,196,140,0,0,0 ; add $0x8c,%esp
+ DB 131,196,28 ; add $0x1c,%esp
DB 94 ; pop %esi
DB 95 ; pop %edi
DB 91 ; pop %ebx
DB 93 ; pop %ebp
DB 195 ; ret
- DB 137,217 ; mov %ebx,%ecx
- DB 136,77,243 ; mov %cl,-0xd(%ebp)
- DB 128,101,243,3 ; andb $0x3,-0xd(%ebp)
- DB 128,125,243,1 ; cmpb $0x1,-0xd(%ebp)
- DB 116,44 ; je 5f60 <_sk_load_bgra_dst_sse2+0x10d>
- DB 102,15,239,219 ; pxor %xmm3,%xmm3
- DB 128,125,243,2 ; cmpb $0x2,-0xd(%ebp)
- DB 139,77,20 ; mov 0x14(%ebp),%ecx
- DB 116,21 ; je 5f56 <_sk_load_bgra_dst_sse2+0x103>
- DB 128,125,243,3 ; cmpb $0x3,-0xd(%ebp)
- DB 15,133,73,255,255,255 ; jne 5e94 <_sk_load_bgra_dst_sse2+0x41>
- DB 102,15,110,100,178,8 ; movd 0x8(%edx,%esi,4),%xmm4
- DB 102,15,112,220,69 ; pshufd $0x45,%xmm4,%xmm3
- DB 102,15,18,28,178 ; movlpd (%edx,%esi,4),%xmm3
- DB 233,52,255,255,255 ; jmp 5e94 <_sk_load_bgra_dst_sse2+0x41>
- DB 102,15,110,28,178 ; movd (%edx,%esi,4),%xmm3
- DB 139,77,20 ; mov 0x14(%ebp),%ecx
- DB 233,39,255,255,255 ; jmp 5e94 <_sk_load_bgra_dst_sse2+0x41>
+ DB 128,227,3 ; and $0x3,%bl
+ DB 128,251,1 ; cmp $0x1,%bl
+ DB 116,39 ; je 4a48 <_sk_load_bgra_dst_sse2+0xd1>
+ DB 102,15,239,228 ; pxor %xmm4,%xmm4
+ DB 128,251,2 ; cmp $0x2,%bl
+ DB 116,20 ; je 4a3e <_sk_load_bgra_dst_sse2+0xc7>
+ DB 128,251,3 ; cmp $0x3,%bl
+ DB 15,133,117,255,255,255 ; jne 49a8 <_sk_load_bgra_dst_sse2+0x31>
+ DB 102,15,110,100,190,8 ; movd 0x8(%esi,%edi,4),%xmm4
+ DB 102,15,112,228,69 ; pshufd $0x45,%xmm4,%xmm4
+ DB 102,15,18,36,190 ; movlpd (%esi,%edi,4),%xmm4
+ DB 233,96,255,255,255 ; jmp 49a8 <_sk_load_bgra_dst_sse2+0x31>
+ DB 102,15,110,36,190 ; movd (%esi,%edi,4),%xmm4
+ DB 233,86,255,255,255 ; jmp 49a8 <_sk_load_bgra_dst_sse2+0x31>
PUBLIC _sk_gather_bgra_sse2
_sk_gather_bgra_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 232,0,0,0,0 ; call 5f7b <_sk_gather_bgra_sse2+0xe>
- DB 90 ; pop %edx
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,77,12 ; mov 0xc(%ebp),%ecx
- DB 139,49 ; mov (%ecx),%esi
- DB 139,62 ; mov (%esi),%edi
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 139,69,12 ; mov 0xc(%ebp),%eax
+ DB 139,8 ; mov (%eax),%ecx
+ DB 139,17 ; mov (%ecx),%edx
DB 243,15,91,201 ; cvttps2dq %xmm1,%xmm1
- DB 102,15,110,86,4 ; movd 0x4(%esi),%xmm2
+ DB 102,15,110,81,4 ; movd 0x4(%ecx),%xmm2
DB 102,15,112,210,0 ; pshufd $0x0,%xmm2,%xmm2
DB 102,15,112,217,245 ; pshufd $0xf5,%xmm1,%xmm3
DB 102,15,244,218 ; pmuludq %xmm2,%xmm3
@@ -43655,59 +42169,45 @@ _sk_gather_bgra_sse2 LABEL PROC
DB 102,15,254,193 ; paddd %xmm1,%xmm0
DB 102,15,112,200,229 ; pshufd $0xe5,%xmm0,%xmm1
DB 102,15,112,208,231 ; pshufd $0xe7,%xmm0,%xmm2
- DB 102,15,126,214 ; movd %xmm2,%esi
- DB 102,15,110,20,183 ; movd (%edi,%esi,4),%xmm2
- DB 102,15,126,206 ; movd %xmm1,%esi
- DB 102,15,110,12,183 ; movd (%edi,%esi,4),%xmm1
- DB 102,15,126,198 ; movd %xmm0,%esi
+ DB 102,15,126,209 ; movd %xmm2,%ecx
+ DB 102,15,110,20,138 ; movd (%edx,%ecx,4),%xmm2
+ DB 102,15,126,201 ; movd %xmm1,%ecx
+ DB 102,15,110,12,138 ; movd (%edx,%ecx,4),%xmm1
+ DB 102,15,126,193 ; movd %xmm0,%ecx
DB 102,15,112,192,78 ; pshufd $0x4e,%xmm0,%xmm0
- DB 102,15,110,28,183 ; movd (%edi,%esi,4),%xmm3
- DB 102,15,126,198 ; movd %xmm0,%esi
- DB 102,15,110,4,183 ; movd (%edi,%esi,4),%xmm0
- DB 139,117,16 ; mov 0x10(%ebp),%esi
- DB 139,125,20 ; mov 0x14(%ebp),%edi
- DB 102,15,111,162,181,64,0,0 ; movdqa 0x40b5(%edx),%xmm4
- DB 15,40,170,197,64,0,0 ; movaps 0x40c5(%edx),%xmm5
- DB 139,85,24 ; mov 0x18(%ebp),%edx
- DB 15,40,117,40 ; movaps 0x28(%ebp),%xmm6
- DB 15,40,125,56 ; movaps 0x38(%ebp),%xmm7
+ DB 102,15,110,28,138 ; movd (%edx,%ecx,4),%xmm3
+ DB 102,15,126,193 ; movd %xmm0,%ecx
+ DB 102,15,110,4,138 ; movd (%edx,%ecx,4),%xmm0
+ DB 232,0,0,0,0 ; call 4ac8 <_sk_gather_bgra_sse2+0x76>
+ DB 89 ; pop %ecx
DB 102,15,98,202 ; punpckldq %xmm2,%xmm1
DB 102,15,98,216 ; punpckldq %xmm0,%xmm3
DB 102,15,98,217 ; punpckldq %xmm1,%xmm3
- DB 102,15,111,211 ; movdqa %xmm3,%xmm2
- DB 102,15,219,212 ; pand %xmm4,%xmm2
+ DB 102,15,111,129,136,50,0,0 ; movdqa 0x3288(%ecx),%xmm0
+ DB 102,15,111,203 ; movdqa %xmm3,%xmm1
+ DB 102,15,219,200 ; pand %xmm0,%xmm1
+ DB 15,91,209 ; cvtdq2ps %xmm1,%xmm2
+ DB 15,40,161,152,50,0,0 ; movaps 0x3298(%ecx),%xmm4
+ DB 15,89,212 ; mulps %xmm4,%xmm2
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,15,114,209,8 ; psrld $0x8,%xmm1
- DB 102,15,219,204 ; pand %xmm4,%xmm1
- DB 102,15,111,195 ; movdqa %xmm3,%xmm0
- DB 102,15,114,208,16 ; psrld $0x10,%xmm0
- DB 102,15,219,196 ; pand %xmm4,%xmm0
- DB 15,40,101,72 ; movaps 0x48(%ebp),%xmm4
- DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,213 ; mulps %xmm5,%xmm2
+ DB 102,15,219,200 ; pand %xmm0,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,205 ; mulps %xmm5,%xmm1
- DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,197 ; mulps %xmm5,%xmm0
+ DB 15,89,204 ; mulps %xmm4,%xmm1
+ DB 102,15,111,235 ; movdqa %xmm3,%xmm5
+ DB 102,15,114,213,16 ; psrld $0x10,%xmm5
+ DB 102,15,219,232 ; pand %xmm0,%xmm5
+ DB 15,91,197 ; cvtdq2ps %xmm5,%xmm0
+ DB 15,89,196 ; mulps %xmm4,%xmm0
DB 102,15,114,211,24 ; psrld $0x18,%xmm3
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,221 ; mulps %xmm5,%xmm3
- DB 15,40,109,88 ; movaps 0x58(%ebp),%xmm5
- DB 141,89,8 ; lea 0x8(%ecx),%ebx
- DB 15,41,108,36,80 ; movaps %xmm5,0x50(%esp)
- DB 15,41,100,36,64 ; movaps %xmm4,0x40(%esp)
- DB 15,41,124,36,48 ; movaps %xmm7,0x30(%esp)
- DB 15,41,116,36,32 ; movaps %xmm6,0x20(%esp)
- DB 137,84,36,16 ; mov %edx,0x10(%esp)
- DB 137,124,36,12 ; mov %edi,0xc(%esp)
- DB 137,116,36,8 ; mov %esi,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
- DB 255,81,4 ; call *0x4(%ecx)
- DB 131,196,108 ; add $0x6c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 15,89,220 ; mulps %xmm4,%xmm3
+ DB 141,72,8 ; lea 0x8(%eax),%ecx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 81 ; push %ecx
+ DB 255,117,8 ; pushl 0x8(%ebp)
+ DB 255,80,4 ; call *0x4(%eax)
+ DB 131,196,24 ; add $0x18,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -43718,10 +42218,19 @@ _sk_store_bgra_sse2 LABEL PROC
DB 83 ; push %ebx
DB 87 ; push %edi
DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 232,0,0,0,0 ; call 60a0 <_sk_store_bgra_sse2+0xe>
- DB 88 ; pop %eax
- DB 15,40,160,176,63,0,0 ; movaps 0x3fb0(%eax),%xmm4
+ DB 131,236,12 ; sub $0xc,%esp
+ DB 232,0,0,0,0 ; call 4b43 <_sk_store_bgra_sse2+0xe>
+ DB 95 ; pop %edi
+ DB 139,69,12 ; mov 0xc(%ebp),%eax
+ DB 139,77,8 ; mov 0x8(%ebp),%ecx
+ DB 139,48 ; mov (%eax),%esi
+ DB 139,86,4 ; mov 0x4(%esi),%edx
+ DB 15,175,81,4 ; imul 0x4(%ecx),%edx
+ DB 193,226,2 ; shl $0x2,%edx
+ DB 3,22 ; add (%esi),%edx
+ DB 139,49 ; mov (%ecx),%esi
+ DB 15,40,167,45,50,0,0 ; movaps 0x322d(%edi),%xmm4
+ DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 15,40,234 ; movaps %xmm2,%xmm5
DB 15,89,236 ; mulps %xmm4,%xmm5
DB 102,15,91,237 ; cvtps2dq %xmm5,%xmm5
@@ -43735,61 +42244,37 @@ _sk_store_bgra_sse2 LABEL PROC
DB 102,15,91,237 ; cvtps2dq %xmm5,%xmm5
DB 102,15,114,245,16 ; pslld $0x10,%xmm5
DB 15,89,227 ; mulps %xmm3,%xmm4
- DB 102,15,91,252 ; cvtps2dq %xmm4,%xmm7
- DB 102,15,114,247,24 ; pslld $0x18,%xmm7
- DB 102,15,235,253 ; por %xmm5,%xmm7
- DB 102,15,235,254 ; por %xmm6,%xmm7
- DB 15,40,117,56 ; movaps 0x38(%ebp),%xmm6
- DB 139,85,24 ; mov 0x18(%ebp),%edx
- DB 139,77,20 ; mov 0x14(%ebp),%ecx
- DB 139,69,12 ; mov 0xc(%ebp),%eax
- DB 139,48 ; mov (%eax),%esi
- DB 139,94,4 ; mov 0x4(%esi),%ebx
- DB 15,175,217 ; imul %ecx,%ebx
- DB 193,227,2 ; shl $0x2,%ebx
- DB 3,30 ; add (%esi),%ebx
- DB 139,125,16 ; mov 0x10(%ebp),%edi
- DB 133,210 ; test %edx,%edx
- DB 139,117,8 ; mov 0x8(%ebp),%esi
- DB 15,40,101,40 ; movaps 0x28(%ebp),%xmm4
- DB 117,66 ; jne 6152 <_sk_store_bgra_sse2+0xc0>
- DB 243,15,127,60,187 ; movdqu %xmm7,(%ebx,%edi,4)
- DB 141,88,8 ; lea 0x8(%eax),%ebx
- DB 15,40,109,88 ; movaps 0x58(%ebp),%xmm5
- DB 15,41,108,36,80 ; movaps %xmm5,0x50(%esp)
- DB 15,40,109,72 ; movaps 0x48(%ebp),%xmm5
- DB 15,41,108,36,64 ; movaps %xmm5,0x40(%esp)
- DB 15,41,116,36,48 ; movaps %xmm6,0x30(%esp)
- DB 15,41,100,36,32 ; movaps %xmm4,0x20(%esp)
- DB 137,84,36,16 ; mov %edx,0x10(%esp)
- DB 137,76,36,12 ; mov %ecx,0xc(%esp)
- DB 137,124,36,8 ; mov %edi,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,52,36 ; mov %esi,(%esp)
+ DB 102,15,91,228 ; cvtps2dq %xmm4,%xmm4
+ DB 102,15,114,244,24 ; pslld $0x18,%xmm4
+ DB 102,15,235,229 ; por %xmm5,%xmm4
+ DB 102,15,235,230 ; por %xmm6,%xmm4
+ DB 133,219 ; test %ebx,%ebx
+ DB 117,24 ; jne 4bc0 <_sk_store_bgra_sse2+0x8b>
+ DB 243,15,127,36,178 ; movdqu %xmm4,(%edx,%esi,4)
+ DB 141,80,8 ; lea 0x8(%eax),%edx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 82 ; push %edx
+ DB 81 ; push %ecx
DB 255,80,4 ; call *0x4(%eax)
- DB 131,196,108 ; add $0x6c,%esp
+ DB 131,196,28 ; add $0x1c,%esp
DB 94 ; pop %esi
DB 95 ; pop %edi
DB 91 ; pop %ebx
DB 93 ; pop %ebp
DB 195 ; ret
- DB 137,209 ; mov %edx,%ecx
- DB 136,77,243 ; mov %cl,-0xd(%ebp)
- DB 128,101,243,3 ; andb $0x3,-0xd(%ebp)
- DB 128,125,243,1 ; cmpb $0x1,-0xd(%ebp)
- DB 116,33 ; je 6182 <_sk_store_bgra_sse2+0xf0>
- DB 128,125,243,2 ; cmpb $0x2,-0xd(%ebp)
- DB 139,77,20 ; mov 0x14(%ebp),%ecx
- DB 116,17 ; je 617b <_sk_store_bgra_sse2+0xe9>
- DB 128,125,243,3 ; cmpb $0x3,-0xd(%ebp)
- DB 117,165 ; jne 6115 <_sk_store_bgra_sse2+0x83>
- DB 102,15,112,239,78 ; pshufd $0x4e,%xmm7,%xmm5
- DB 102,15,126,108,187,8 ; movd %xmm5,0x8(%ebx,%edi,4)
- DB 102,15,214,60,187 ; movq %xmm7,(%ebx,%edi,4)
- DB 235,147 ; jmp 6115 <_sk_store_bgra_sse2+0x83>
- DB 102,15,126,60,187 ; movd %xmm7,(%ebx,%edi,4)
- DB 139,77,20 ; mov 0x14(%ebp),%ecx
- DB 235,137 ; jmp 6115 <_sk_store_bgra_sse2+0x83>
+ DB 128,227,3 ; and $0x3,%bl
+ DB 128,251,1 ; cmp $0x1,%bl
+ DB 116,28 ; je 4be4 <_sk_store_bgra_sse2+0xaf>
+ DB 128,251,2 ; cmp $0x2,%bl
+ DB 116,16 ; je 4bdd <_sk_store_bgra_sse2+0xa8>
+ DB 128,251,3 ; cmp $0x3,%bl
+ DB 117,219 ; jne 4bad <_sk_store_bgra_sse2+0x78>
+ DB 102,15,112,236,78 ; pshufd $0x4e,%xmm4,%xmm5
+ DB 102,15,126,108,178,8 ; movd %xmm5,0x8(%edx,%esi,4)
+ DB 102,15,214,36,178 ; movq %xmm4,(%edx,%esi,4)
+ DB 235,201 ; jmp 4bad <_sk_store_bgra_sse2+0x78>
+ DB 102,15,126,36,178 ; movd %xmm4,(%edx,%esi,4)
+ DB 235,194 ; jmp 4bad <_sk_store_bgra_sse2+0x78>
PUBLIC _sk_load_f16_sse2
_sk_load_f16_sse2 LABEL PROC
@@ -43798,138 +42283,126 @@ _sk_load_f16_sse2 LABEL PROC
DB 83 ; push %ebx
DB 87 ; push %edi
DB 86 ; push %esi
- DB 129,236,188,0,0,0 ; sub $0xbc,%esp
- DB 232,0,0,0,0 ; call 619d <_sk_load_f16_sse2+0x11>
- DB 91 ; pop %ebx
- DB 139,77,20 ; mov 0x14(%ebp),%ecx
+ DB 131,236,92 ; sub $0x5c,%esp
+ DB 232,0,0,0,0 ; call 4bf9 <_sk_load_f16_sse2+0xe>
+ DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
- DB 139,48 ; mov (%eax),%esi
- DB 139,86,4 ; mov 0x4(%esi),%edx
- DB 15,175,209 ; imul %ecx,%edx
- DB 193,226,3 ; shl $0x3,%edx
- DB 3,22 ; add (%esi),%edx
- DB 139,125,24 ; mov 0x18(%ebp),%edi
- DB 133,255 ; test %edi,%edi
- DB 139,117,16 ; mov 0x10(%ebp),%esi
- DB 15,133,220,1,0,0 ; jne 639b <_sk_load_f16_sse2+0x20f>
- DB 102,15,16,4,242 ; movupd (%edx,%esi,8),%xmm0
- DB 243,15,111,76,242,16 ; movdqu 0x10(%edx,%esi,8),%xmm1
- DB 102,15,40,208 ; movapd %xmm0,%xmm2
- DB 102,15,97,209 ; punpcklwd %xmm1,%xmm2
+ DB 139,77,8 ; mov 0x8(%ebp),%ecx
+ DB 139,56 ; mov (%eax),%edi
+ DB 139,119,4 ; mov 0x4(%edi),%esi
+ DB 15,175,113,4 ; imul 0x4(%ecx),%esi
+ DB 193,230,3 ; shl $0x3,%esi
+ DB 3,55 ; add (%edi),%esi
+ DB 139,89,8 ; mov 0x8(%ecx),%ebx
+ DB 133,219 ; test %ebx,%ebx
+ DB 139,57 ; mov (%ecx),%edi
+ DB 15,133,160,1,0,0 ; jne 4dbb <_sk_load_f16_sse2+0x1d0>
+ DB 102,15,16,4,254 ; movupd (%esi,%edi,8),%xmm0
+ DB 243,15,111,76,254,16 ; movdqu 0x10(%esi,%edi,8),%xmm1
+ DB 102,15,40,216 ; movapd %xmm0,%xmm3
+ DB 102,15,97,217 ; punpcklwd %xmm1,%xmm3
DB 102,15,105,193 ; punpckhwd %xmm1,%xmm0
- DB 102,15,111,202 ; movdqa %xmm2,%xmm1
- DB 102,15,97,200 ; punpcklwd %xmm0,%xmm1
- DB 102,15,105,208 ; punpckhwd %xmm0,%xmm2
- DB 102,15,126,77,208 ; movd %xmm1,-0x30(%ebp)
- DB 102,15,112,193,229 ; pshufd $0xe5,%xmm1,%xmm0
+ DB 102,15,111,211 ; movdqa %xmm3,%xmm2
+ DB 102,15,97,208 ; punpcklwd %xmm0,%xmm2
+ DB 102,15,105,216 ; punpckhwd %xmm0,%xmm3
+ DB 102,15,126,85,208 ; movd %xmm2,-0x30(%ebp)
+ DB 102,15,112,194,229 ; pshufd $0xe5,%xmm2,%xmm0
DB 102,15,126,69,212 ; movd %xmm0,-0x2c(%ebp)
- DB 243,15,126,117,208 ; movq -0x30(%ebp),%xmm6
- DB 102,15,112,193,231 ; pshufd $0xe7,%xmm1,%xmm0
+ DB 243,15,126,77,208 ; movq -0x30(%ebp),%xmm1
+ DB 102,15,112,194,231 ; pshufd $0xe7,%xmm2,%xmm0
DB 102,15,126,69,220 ; movd %xmm0,-0x24(%ebp)
- DB 102,15,112,193,78 ; pshufd $0x4e,%xmm1,%xmm0
+ DB 102,15,112,194,78 ; pshufd $0x4e,%xmm2,%xmm0
DB 102,15,126,69,216 ; movd %xmm0,-0x28(%ebp)
- DB 243,15,126,101,216 ; movq -0x28(%ebp),%xmm4
- DB 102,15,126,85,224 ; movd %xmm2,-0x20(%ebp)
- DB 102,15,112,194,229 ; pshufd $0xe5,%xmm2,%xmm0
+ DB 243,15,126,125,216 ; movq -0x28(%ebp),%xmm7
+ DB 102,15,126,93,224 ; movd %xmm3,-0x20(%ebp)
+ DB 102,15,112,195,229 ; pshufd $0xe5,%xmm3,%xmm0
DB 102,15,126,69,228 ; movd %xmm0,-0x1c(%ebp)
- DB 243,15,126,125,224 ; movq -0x20(%ebp),%xmm7
- DB 102,15,112,194,231 ; pshufd $0xe7,%xmm2,%xmm0
+ DB 243,15,126,109,224 ; movq -0x20(%ebp),%xmm5
+ DB 102,15,112,195,231 ; pshufd $0xe7,%xmm3,%xmm0
DB 102,15,126,69,236 ; movd %xmm0,-0x14(%ebp)
- DB 102,15,112,194,78 ; pshufd $0x4e,%xmm2,%xmm0
+ DB 102,15,112,195,78 ; pshufd $0x4e,%xmm3,%xmm0
DB 102,15,126,69,232 ; movd %xmm0,-0x18(%ebp)
- DB 102,15,239,219 ; pxor %xmm3,%xmm3
- DB 102,15,97,243 ; punpcklwd %xmm3,%xmm6
- DB 102,15,111,171,195,62,0,0 ; movdqa 0x3ec3(%ebx),%xmm5
- DB 102,15,111,214 ; movdqa %xmm6,%xmm2
- DB 102,15,219,213 ; pand %xmm5,%xmm2
- DB 102,15,239,242 ; pxor %xmm2,%xmm6
- DB 102,15,114,242,16 ; pslld $0x10,%xmm2
- DB 102,15,111,206 ; movdqa %xmm6,%xmm1
- DB 102,15,114,241,13 ; pslld $0xd,%xmm1
- DB 102,15,235,202 ; por %xmm2,%xmm1
- DB 102,15,111,212 ; movdqa %xmm4,%xmm2
- DB 102,15,97,211 ; punpcklwd %xmm3,%xmm2
- DB 102,15,111,226 ; movdqa %xmm2,%xmm4
- DB 102,15,219,229 ; pand %xmm5,%xmm4
- DB 102,15,239,212 ; pxor %xmm4,%xmm2
- DB 102,15,127,85,152 ; movdqa %xmm2,-0x68(%ebp)
+ DB 102,15,239,192 ; pxor %xmm0,%xmm0
+ DB 102,15,97,200 ; punpcklwd %xmm0,%xmm1
+ DB 102,15,111,154,135,49,0,0 ; movdqa 0x3187(%edx),%xmm3
+ DB 102,15,111,225 ; movdqa %xmm1,%xmm4
+ DB 102,15,219,227 ; pand %xmm3,%xmm4
+ DB 102,15,239,204 ; pxor %xmm4,%xmm1
DB 102,15,114,244,16 ; pslld $0x10,%xmm4
+ DB 102,15,111,209 ; movdqa %xmm1,%xmm2
DB 102,15,114,242,13 ; pslld $0xd,%xmm2
DB 102,15,235,212 ; por %xmm4,%xmm2
+ DB 102,15,97,248 ; punpcklwd %xmm0,%xmm7
DB 102,15,111,231 ; movdqa %xmm7,%xmm4
- DB 102,15,97,227 ; punpcklwd %xmm3,%xmm4
- DB 102,15,111,252 ; movdqa %xmm4,%xmm7
- DB 102,15,219,253 ; pand %xmm5,%xmm7
- DB 102,15,239,231 ; pxor %xmm7,%xmm4
- DB 102,15,127,101,168 ; movdqa %xmm4,-0x58(%ebp)
+ DB 102,15,219,227 ; pand %xmm3,%xmm4
+ DB 102,15,239,252 ; pxor %xmm4,%xmm7
+ DB 102,15,127,125,152 ; movdqa %xmm7,-0x68(%ebp)
+ DB 102,15,114,244,16 ; pslld $0x10,%xmm4
+ DB 102,15,111,247 ; movdqa %xmm7,%xmm6
+ DB 102,15,114,246,13 ; pslld $0xd,%xmm6
+ DB 102,15,235,244 ; por %xmm4,%xmm6
+ DB 102,15,97,232 ; punpcklwd %xmm0,%xmm5
+ DB 102,15,111,253 ; movdqa %xmm5,%xmm7
+ DB 102,15,219,251 ; pand %xmm3,%xmm7
+ DB 102,15,239,239 ; pxor %xmm7,%xmm5
+ DB 102,15,127,109,168 ; movdqa %xmm5,-0x58(%ebp)
DB 102,15,114,247,16 ; pslld $0x10,%xmm7
- DB 102,15,114,244,13 ; pslld $0xd,%xmm4
- DB 102,15,235,231 ; por %xmm7,%xmm4
+ DB 102,15,114,245,13 ; pslld $0xd,%xmm5
+ DB 102,15,235,239 ; por %xmm7,%xmm5
DB 243,15,126,125,232 ; movq -0x18(%ebp),%xmm7
- DB 102,15,97,251 ; punpcklwd %xmm3,%xmm7
- DB 102,15,219,239 ; pand %xmm7,%xmm5
- DB 102,15,239,253 ; pxor %xmm5,%xmm7
- DB 102,15,114,245,16 ; pslld $0x10,%xmm5
+ DB 102,15,97,248 ; punpcklwd %xmm0,%xmm7
+ DB 102,15,219,223 ; pand %xmm7,%xmm3
+ DB 102,15,239,251 ; pxor %xmm3,%xmm7
+ DB 102,15,114,243,16 ; pslld $0x10,%xmm3
DB 102,15,111,199 ; movdqa %xmm7,%xmm0
DB 102,15,114,240,13 ; pslld $0xd,%xmm0
- DB 102,15,235,197 ; por %xmm5,%xmm0
- DB 102,15,111,155,211,62,0,0 ; movdqa 0x3ed3(%ebx),%xmm3
- DB 102,15,254,203 ; paddd %xmm3,%xmm1
+ DB 102,15,235,195 ; por %xmm3,%xmm0
+ DB 102,15,111,154,151,49,0,0 ; movdqa 0x3197(%edx),%xmm3
DB 102,15,254,211 ; paddd %xmm3,%xmm2
- DB 102,15,254,227 ; paddd %xmm3,%xmm4
+ DB 102,15,254,243 ; paddd %xmm3,%xmm6
+ DB 102,15,254,235 ; paddd %xmm3,%xmm5
DB 102,15,254,195 ; paddd %xmm3,%xmm0
- DB 102,15,111,155,227,62,0,0 ; movdqa 0x3ee3(%ebx),%xmm3
+ DB 102,15,111,154,167,49,0,0 ; movdqa 0x31a7(%edx),%xmm3
DB 102,15,127,93,184 ; movdqa %xmm3,-0x48(%ebp)
- DB 102,15,239,243 ; pxor %xmm3,%xmm6
- DB 102,15,111,155,243,62,0,0 ; movdqa 0x3ef3(%ebx),%xmm3
- DB 102,15,111,235 ; movdqa %xmm3,%xmm5
- DB 102,15,102,238 ; pcmpgtd %xmm6,%xmm5
- DB 102,15,223,233 ; pandn %xmm1,%xmm5
- DB 102,15,111,117,152 ; movdqa -0x68(%ebp),%xmm6
- DB 102,15,239,117,184 ; pxor -0x48(%ebp),%xmm6
+ DB 102,15,239,203 ; pxor %xmm3,%xmm1
+ DB 102,15,111,154,183,49,0,0 ; movdqa 0x31b7(%edx),%xmm3
+ DB 102,15,111,227 ; movdqa %xmm3,%xmm4
+ DB 102,15,102,225 ; pcmpgtd %xmm1,%xmm4
+ DB 102,15,223,226 ; pandn %xmm2,%xmm4
+ DB 102,15,111,85,152 ; movdqa -0x68(%ebp),%xmm2
+ DB 102,15,239,85,184 ; pxor -0x48(%ebp),%xmm2
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
- DB 102,15,102,206 ; pcmpgtd %xmm6,%xmm1
- DB 102,15,223,202 ; pandn %xmm2,%xmm1
+ DB 102,15,102,202 ; pcmpgtd %xmm2,%xmm1
+ DB 102,15,223,206 ; pandn %xmm6,%xmm1
DB 102,15,111,117,168 ; movdqa -0x58(%ebp),%xmm6
DB 102,15,239,117,184 ; pxor -0x48(%ebp),%xmm6
DB 102,15,111,211 ; movdqa %xmm3,%xmm2
DB 102,15,102,214 ; pcmpgtd %xmm6,%xmm2
- DB 102,15,223,212 ; pandn %xmm4,%xmm2
+ DB 102,15,223,213 ; pandn %xmm5,%xmm2
DB 102,15,239,125,184 ; pxor -0x48(%ebp),%xmm7
DB 102,15,102,223 ; pcmpgtd %xmm7,%xmm3
DB 102,15,223,216 ; pandn %xmm0,%xmm3
DB 141,80,8 ; lea 0x8(%eax),%edx
- DB 15,40,69,88 ; movaps 0x58(%ebp),%xmm0
- DB 15,41,68,36,80 ; movaps %xmm0,0x50(%esp)
- DB 15,40,69,72 ; movaps 0x48(%ebp),%xmm0
- DB 15,41,68,36,64 ; movaps %xmm0,0x40(%esp)
- DB 15,40,69,56 ; movaps 0x38(%ebp),%xmm0
- DB 15,41,68,36,48 ; movaps %xmm0,0x30(%esp)
- DB 15,40,69,40 ; movaps 0x28(%ebp),%xmm0
- DB 15,41,68,36,32 ; movaps %xmm0,0x20(%esp)
- DB 137,124,36,16 ; mov %edi,0x10(%esp)
- DB 137,76,36,12 ; mov %ecx,0xc(%esp)
- DB 137,116,36,8 ; mov %esi,0x8(%esp)
- DB 137,84,36,4 ; mov %edx,0x4(%esp)
- DB 139,77,8 ; mov 0x8(%ebp),%ecx
- DB 137,12,36 ; mov %ecx,(%esp)
- DB 102,15,111,197 ; movdqa %xmm5,%xmm0
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 102,15,111,196 ; movdqa %xmm4,%xmm0
+ DB 82 ; push %edx
+ DB 81 ; push %ecx
DB 255,80,4 ; call *0x4(%eax)
- DB 129,196,188,0,0,0 ; add $0xbc,%esp
+ DB 131,196,108 ; add $0x6c,%esp
DB 94 ; pop %esi
DB 95 ; pop %edi
DB 91 ; pop %ebx
DB 93 ; pop %ebp
DB 195 ; ret
- DB 242,15,16,4,242 ; movsd (%edx,%esi,8),%xmm0
+ DB 242,15,16,4,254 ; movsd (%esi,%edi,8),%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
- DB 131,255,1 ; cmp $0x1,%edi
- DB 15,132,29,254,255,255 ; je 61ca <_sk_load_f16_sse2+0x3e>
- DB 102,15,22,68,242,8 ; movhpd 0x8(%edx,%esi,8),%xmm0
- DB 131,255,3 ; cmp $0x3,%edi
- DB 15,130,14,254,255,255 ; jb 61ca <_sk_load_f16_sse2+0x3e>
- DB 243,15,126,76,242,16 ; movq 0x10(%edx,%esi,8),%xmm1
- DB 233,3,254,255,255 ; jmp 61ca <_sk_load_f16_sse2+0x3e>
+ DB 131,251,1 ; cmp $0x1,%ebx
+ DB 15,132,89,254,255,255 ; je 4c26 <_sk_load_f16_sse2+0x3b>
+ DB 102,15,22,68,254,8 ; movhpd 0x8(%esi,%edi,8),%xmm0
+ DB 131,251,3 ; cmp $0x3,%ebx
+ DB 15,130,74,254,255,255 ; jb 4c26 <_sk_load_f16_sse2+0x3b>
+ DB 243,15,126,76,254,16 ; movq 0x10(%esi,%edi,8),%xmm1
+ DB 233,63,254,255,255 ; jmp 4c26 <_sk_load_f16_sse2+0x3b>
PUBLIC _sk_load_f16_dst_sse2
_sk_load_f16_dst_sse2 LABEL PROC
@@ -43938,158 +42411,150 @@ _sk_load_f16_dst_sse2 LABEL PROC
DB 83 ; push %ebx
DB 87 ; push %edi
DB 86 ; push %esi
- DB 129,236,252,0,0,0 ; sub $0xfc,%esp
- DB 15,41,157,88,255,255,255 ; movaps %xmm3,-0xa8(%ebp)
- DB 102,15,127,149,104,255,255,255 ; movdqa %xmm2,-0x98(%ebp)
- DB 15,41,141,120,255,255,255 ; movaps %xmm1,-0x88(%ebp)
- DB 102,15,127,69,136 ; movdqa %xmm0,-0x78(%ebp)
- DB 232,0,0,0,0 ; call 63f3 <_sk_load_f16_dst_sse2+0x2c>
- DB 91 ; pop %ebx
- DB 139,77,20 ; mov 0x14(%ebp),%ecx
+ DB 129,236,140,0,0,0 ; sub $0x8c,%esp
+ DB 15,41,157,104,255,255,255 ; movaps %xmm3,-0x98(%ebp)
+ DB 15,41,149,120,255,255,255 ; movaps %xmm2,-0x88(%ebp)
+ DB 102,15,127,77,136 ; movdqa %xmm1,-0x78(%ebp)
+ DB 15,41,69,152 ; movaps %xmm0,-0x68(%ebp)
+ DB 232,0,0,0,0 ; call 4e0f <_sk_load_f16_dst_sse2+0x28>
+ DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
- DB 139,48 ; mov (%eax),%esi
- DB 139,86,4 ; mov 0x4(%esi),%edx
- DB 15,175,209 ; imul %ecx,%edx
- DB 193,226,3 ; shl $0x3,%edx
- DB 3,22 ; add (%esi),%edx
- DB 139,125,24 ; mov 0x18(%ebp),%edi
- DB 133,255 ; test %edi,%edi
- DB 139,117,16 ; mov 0x10(%ebp),%esi
- DB 15,133,233,1,0,0 ; jne 65fe <_sk_load_f16_dst_sse2+0x237>
- DB 102,15,16,12,242 ; movupd (%edx,%esi,8),%xmm1
- DB 243,15,111,68,242,16 ; movdqu 0x10(%edx,%esi,8),%xmm0
- DB 102,15,40,217 ; movapd %xmm1,%xmm3
+ DB 139,77,8 ; mov 0x8(%ebp),%ecx
+ DB 139,56 ; mov (%eax),%edi
+ DB 139,119,4 ; mov 0x4(%edi),%esi
+ DB 15,175,113,4 ; imul 0x4(%ecx),%esi
+ DB 193,230,3 ; shl $0x3,%esi
+ DB 3,55 ; add (%edi),%esi
+ DB 139,89,8 ; mov 0x8(%ecx),%ebx
+ DB 133,219 ; test %ebx,%ebx
+ DB 139,57 ; mov (%ecx),%edi
+ DB 15,133,206,1,0,0 ; jne 4fff <_sk_load_f16_dst_sse2+0x218>
+ DB 102,15,16,4,254 ; movupd (%esi,%edi,8),%xmm0
+ DB 243,15,111,76,254,16 ; movdqu 0x10(%esi,%edi,8),%xmm1
+ DB 102,15,40,208 ; movapd %xmm0,%xmm2
+ DB 102,15,97,209 ; punpcklwd %xmm1,%xmm2
+ DB 102,15,105,193 ; punpckhwd %xmm1,%xmm0
+ DB 102,15,111,218 ; movdqa %xmm2,%xmm3
DB 102,15,97,216 ; punpcklwd %xmm0,%xmm3
- DB 102,15,105,200 ; punpckhwd %xmm0,%xmm1
- DB 102,15,111,195 ; movdqa %xmm3,%xmm0
- DB 102,15,97,193 ; punpcklwd %xmm1,%xmm0
- DB 102,15,105,217 ; punpckhwd %xmm1,%xmm3
- DB 102,15,126,69,208 ; movd %xmm0,-0x30(%ebp)
- DB 102,15,112,200,229 ; pshufd $0xe5,%xmm0,%xmm1
- DB 102,15,126,77,212 ; movd %xmm1,-0x2c(%ebp)
- DB 243,15,126,117,208 ; movq -0x30(%ebp),%xmm6
- DB 102,15,112,200,231 ; pshufd $0xe7,%xmm0,%xmm1
- DB 102,15,126,77,220 ; movd %xmm1,-0x24(%ebp)
- DB 102,15,112,192,78 ; pshufd $0x4e,%xmm0,%xmm0
- DB 102,15,126,69,216 ; movd %xmm0,-0x28(%ebp)
- DB 243,15,126,109,216 ; movq -0x28(%ebp),%xmm5
- DB 102,15,126,93,224 ; movd %xmm3,-0x20(%ebp)
+ DB 102,15,105,208 ; punpckhwd %xmm0,%xmm2
+ DB 102,15,126,93,208 ; movd %xmm3,-0x30(%ebp)
DB 102,15,112,195,229 ; pshufd $0xe5,%xmm3,%xmm0
- DB 102,15,126,69,228 ; movd %xmm0,-0x1c(%ebp)
- DB 243,15,126,77,224 ; movq -0x20(%ebp),%xmm1
+ DB 102,15,126,69,212 ; movd %xmm0,-0x2c(%ebp)
+ DB 243,15,126,101,208 ; movq -0x30(%ebp),%xmm4
DB 102,15,112,195,231 ; pshufd $0xe7,%xmm3,%xmm0
- DB 102,15,126,69,236 ; movd %xmm0,-0x14(%ebp)
+ DB 102,15,126,69,220 ; movd %xmm0,-0x24(%ebp)
DB 102,15,112,195,78 ; pshufd $0x4e,%xmm3,%xmm0
- DB 102,15,126,69,232 ; movd %xmm0,-0x18(%ebp)
- DB 102,15,239,192 ; pxor %xmm0,%xmm0
- DB 102,15,97,240 ; punpcklwd %xmm0,%xmm6
- DB 102,15,239,228 ; pxor %xmm4,%xmm4
- DB 102,15,111,155,173,60,0,0 ; movdqa 0x3cad(%ebx),%xmm3
- DB 102,15,111,198 ; movdqa %xmm6,%xmm0
- DB 102,15,219,195 ; pand %xmm3,%xmm0
- DB 102,15,239,240 ; pxor %xmm0,%xmm6
- DB 102,15,114,240,16 ; pslld $0x10,%xmm0
+ DB 102,15,126,69,216 ; movd %xmm0,-0x28(%ebp)
+ DB 243,15,126,69,216 ; movq -0x28(%ebp),%xmm0
+ DB 102,15,126,85,224 ; movd %xmm2,-0x20(%ebp)
+ DB 102,15,112,218,229 ; pshufd $0xe5,%xmm2,%xmm3
+ DB 102,15,126,93,228 ; movd %xmm3,-0x1c(%ebp)
+ DB 243,15,126,109,224 ; movq -0x20(%ebp),%xmm5
+ DB 102,15,112,218,231 ; pshufd $0xe7,%xmm2,%xmm3
+ DB 102,15,126,93,236 ; movd %xmm3,-0x14(%ebp)
+ DB 102,15,112,210,78 ; pshufd $0x4e,%xmm2,%xmm2
+ DB 102,15,126,85,232 ; movd %xmm2,-0x18(%ebp)
+ DB 102,15,239,201 ; pxor %xmm1,%xmm1
+ DB 102,15,97,225 ; punpcklwd %xmm1,%xmm4
+ DB 102,15,111,154,177,47,0,0 ; movdqa 0x2fb1(%edx),%xmm3
+ DB 102,15,111,212 ; movdqa %xmm4,%xmm2
+ DB 102,15,219,211 ; pand %xmm3,%xmm2
+ DB 102,15,239,226 ; pxor %xmm2,%xmm4
+ DB 102,15,114,242,16 ; pslld $0x10,%xmm2
+ DB 102,15,111,204 ; movdqa %xmm4,%xmm1
+ DB 102,15,114,241,13 ; pslld $0xd,%xmm1
+ DB 102,15,235,202 ; por %xmm2,%xmm1
+ DB 102,15,111,146,209,47,0,0 ; movdqa 0x2fd1(%edx),%xmm2
+ DB 102,15,127,85,168 ; movdqa %xmm2,-0x58(%ebp)
+ DB 102,15,239,226 ; pxor %xmm2,%xmm4
+ DB 102,15,111,178,225,47,0,0 ; movdqa 0x2fe1(%edx),%xmm6
DB 102,15,111,254 ; movdqa %xmm6,%xmm7
+ DB 102,15,102,252 ; pcmpgtd %xmm4,%xmm7
+ DB 102,15,111,146,193,47,0,0 ; movdqa 0x2fc1(%edx),%xmm2
+ DB 102,15,127,85,184 ; movdqa %xmm2,-0x48(%ebp)
+ DB 102,15,254,202 ; paddd %xmm2,%xmm1
+ DB 102,15,223,249 ; pandn %xmm1,%xmm7
+ DB 243,15,126,85,232 ; movq -0x18(%ebp),%xmm2
+ DB 102,15,127,121,16 ; movdqa %xmm7,0x10(%ecx)
+ DB 102,15,239,201 ; pxor %xmm1,%xmm1
+ DB 102,15,97,193 ; punpcklwd %xmm1,%xmm0
+ DB 102,15,111,200 ; movdqa %xmm0,%xmm1
+ DB 102,15,219,203 ; pand %xmm3,%xmm1
+ DB 102,15,239,193 ; pxor %xmm1,%xmm0
+ DB 102,15,114,241,16 ; pslld $0x10,%xmm1
+ DB 102,15,111,248 ; movdqa %xmm0,%xmm7
DB 102,15,114,247,13 ; pslld $0xd,%xmm7
- DB 102,15,235,248 ; por %xmm0,%xmm7
- DB 102,15,97,236 ; punpcklwd %xmm4,%xmm5
+ DB 102,15,235,249 ; por %xmm1,%xmm7
+ DB 102,15,111,101,168 ; movdqa -0x58(%ebp),%xmm4
+ DB 102,15,239,196 ; pxor %xmm4,%xmm0
+ DB 102,15,111,206 ; movdqa %xmm6,%xmm1
+ DB 102,15,102,200 ; pcmpgtd %xmm0,%xmm1
+ DB 102,15,254,125,184 ; paddd -0x48(%ebp),%xmm7
+ DB 102,15,223,207 ; pandn %xmm7,%xmm1
+ DB 102,15,127,73,32 ; movdqa %xmm1,0x20(%ecx)
+ DB 102,15,239,255 ; pxor %xmm7,%xmm7
+ DB 102,15,97,239 ; punpcklwd %xmm7,%xmm5
DB 102,15,111,197 ; movdqa %xmm5,%xmm0
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 102,15,239,232 ; pxor %xmm0,%xmm5
- DB 102,15,127,109,152 ; movdqa %xmm5,-0x68(%ebp)
- DB 102,15,114,240,16 ; pslld $0x10,%xmm0
- DB 102,15,114,245,13 ; pslld $0xd,%xmm5
- DB 102,15,235,232 ; por %xmm0,%xmm5
- DB 102,15,239,210 ; pxor %xmm2,%xmm2
- DB 102,15,97,202 ; punpcklwd %xmm2,%xmm1
- DB 102,15,111,193 ; movdqa %xmm1,%xmm0
- DB 102,15,219,195 ; pand %xmm3,%xmm0
- DB 102,15,239,200 ; pxor %xmm0,%xmm1
- DB 102,15,127,77,168 ; movdqa %xmm1,-0x58(%ebp)
DB 102,15,114,240,16 ; pslld $0x10,%xmm0
- DB 102,15,111,225 ; movdqa %xmm1,%xmm4
- DB 102,15,114,244,13 ; pslld $0xd,%xmm4
- DB 102,15,235,224 ; por %xmm0,%xmm4
- DB 243,15,126,77,232 ; movq -0x18(%ebp),%xmm1
- DB 102,15,97,202 ; punpcklwd %xmm2,%xmm1
- DB 102,15,219,217 ; pand %xmm1,%xmm3
- DB 102,15,239,203 ; pxor %xmm3,%xmm1
+ DB 102,15,111,205 ; movdqa %xmm5,%xmm1
+ DB 102,15,114,241,13 ; pslld $0xd,%xmm1
+ DB 102,15,235,200 ; por %xmm0,%xmm1
+ DB 102,15,239,236 ; pxor %xmm4,%xmm5
+ DB 102,15,111,198 ; movdqa %xmm6,%xmm0
+ DB 102,15,102,197 ; pcmpgtd %xmm5,%xmm0
+ DB 102,15,111,109,184 ; movdqa -0x48(%ebp),%xmm5
+ DB 102,15,254,205 ; paddd %xmm5,%xmm1
+ DB 102,15,223,193 ; pandn %xmm1,%xmm0
+ DB 102,15,127,65,48 ; movdqa %xmm0,0x30(%ecx)
+ DB 102,15,97,215 ; punpcklwd %xmm7,%xmm2
+ DB 102,15,219,218 ; pand %xmm2,%xmm3
+ DB 102,15,239,211 ; pxor %xmm3,%xmm2
DB 102,15,114,243,16 ; pslld $0x10,%xmm3
- DB 102,15,111,209 ; movdqa %xmm1,%xmm2
- DB 102,15,114,242,13 ; pslld $0xd,%xmm2
- DB 102,15,235,211 ; por %xmm3,%xmm2
- DB 102,15,111,155,189,60,0,0 ; movdqa 0x3cbd(%ebx),%xmm3
- DB 102,15,254,251 ; paddd %xmm3,%xmm7
- DB 102,15,254,235 ; paddd %xmm3,%xmm5
- DB 102,15,254,227 ; paddd %xmm3,%xmm4
- DB 102,15,254,211 ; paddd %xmm3,%xmm2
- DB 102,15,111,131,205,60,0,0 ; movdqa 0x3ccd(%ebx),%xmm0
- DB 102,15,127,69,184 ; movdqa %xmm0,-0x48(%ebp)
- DB 102,15,239,240 ; pxor %xmm0,%xmm6
- DB 102,15,111,131,221,60,0,0 ; movdqa 0x3cdd(%ebx),%xmm0
- DB 102,15,111,216 ; movdqa %xmm0,%xmm3
- DB 102,15,102,222 ; pcmpgtd %xmm6,%xmm3
- DB 102,15,223,223 ; pandn %xmm7,%xmm3
- DB 102,15,111,125,152 ; movdqa -0x68(%ebp),%xmm7
- DB 102,15,239,125,184 ; pxor -0x48(%ebp),%xmm7
- DB 102,15,111,240 ; movdqa %xmm0,%xmm6
- DB 102,15,102,247 ; pcmpgtd %xmm7,%xmm6
- DB 102,15,223,245 ; pandn %xmm5,%xmm6
- DB 102,15,111,125,168 ; movdqa -0x58(%ebp),%xmm7
- DB 102,15,239,125,184 ; pxor -0x48(%ebp),%xmm7
- DB 102,15,111,232 ; movdqa %xmm0,%xmm5
- DB 102,15,102,239 ; pcmpgtd %xmm7,%xmm5
- DB 102,15,223,236 ; pandn %xmm4,%xmm5
- DB 102,15,239,77,184 ; pxor -0x48(%ebp),%xmm1
- DB 102,15,102,193 ; pcmpgtd %xmm1,%xmm0
- DB 102,15,223,194 ; pandn %xmm2,%xmm0
+ DB 102,15,111,194 ; movdqa %xmm2,%xmm0
+ DB 102,15,114,240,13 ; pslld $0xd,%xmm0
+ DB 102,15,235,195 ; por %xmm3,%xmm0
+ DB 102,15,254,197 ; paddd %xmm5,%xmm0
+ DB 102,15,239,212 ; pxor %xmm4,%xmm2
+ DB 102,15,102,242 ; pcmpgtd %xmm2,%xmm6
+ DB 102,15,223,240 ; pandn %xmm0,%xmm6
+ DB 102,15,127,113,64 ; movdqa %xmm6,0x40(%ecx)
DB 141,80,8 ; lea 0x8(%eax),%edx
- DB 137,124,36,16 ; mov %edi,0x10(%esp)
- DB 137,76,36,12 ; mov %ecx,0xc(%esp)
- DB 137,116,36,8 ; mov %esi,0x8(%esp)
- DB 137,84,36,4 ; mov %edx,0x4(%esp)
- DB 139,77,8 ; mov 0x8(%ebp),%ecx
- DB 137,12,36 ; mov %ecx,(%esp)
- DB 102,15,127,68,36,80 ; movdqa %xmm0,0x50(%esp)
- DB 102,15,127,108,36,64 ; movdqa %xmm5,0x40(%esp)
- DB 102,15,127,116,36,48 ; movdqa %xmm6,0x30(%esp)
- DB 102,15,127,92,36,32 ; movdqa %xmm3,0x20(%esp)
- DB 15,40,69,136 ; movaps -0x78(%ebp),%xmm0
- DB 15,40,141,120,255,255,255 ; movaps -0x88(%ebp),%xmm1
- DB 15,40,149,104,255,255,255 ; movaps -0x98(%ebp),%xmm2
- DB 15,40,157,88,255,255,255 ; movaps -0xa8(%ebp),%xmm3
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 15,40,69,152 ; movaps -0x68(%ebp),%xmm0
+ DB 15,40,77,136 ; movaps -0x78(%ebp),%xmm1
+ DB 15,40,149,120,255,255,255 ; movaps -0x88(%ebp),%xmm2
+ DB 15,40,157,104,255,255,255 ; movaps -0x98(%ebp),%xmm3
+ DB 82 ; push %edx
+ DB 81 ; push %ecx
DB 255,80,4 ; call *0x4(%eax)
- DB 129,196,252,0,0,0 ; add $0xfc,%esp
+ DB 129,196,156,0,0,0 ; add $0x9c,%esp
DB 94 ; pop %esi
DB 95 ; pop %edi
DB 91 ; pop %ebx
DB 93 ; pop %ebp
DB 195 ; ret
- DB 242,15,16,12,242 ; movsd (%edx,%esi,8),%xmm1
- DB 102,15,239,192 ; pxor %xmm0,%xmm0
- DB 131,255,1 ; cmp $0x1,%edi
- DB 15,132,16,254,255,255 ; je 6420 <_sk_load_f16_dst_sse2+0x59>
- DB 102,15,22,76,242,8 ; movhpd 0x8(%edx,%esi,8),%xmm1
- DB 131,255,3 ; cmp $0x3,%edi
- DB 15,130,1,254,255,255 ; jb 6420 <_sk_load_f16_dst_sse2+0x59>
- DB 243,15,126,68,242,16 ; movq 0x10(%edx,%esi,8),%xmm0
- DB 233,246,253,255,255 ; jmp 6420 <_sk_load_f16_dst_sse2+0x59>
+ DB 242,15,16,4,254 ; movsd (%esi,%edi,8),%xmm0
+ DB 102,15,239,201 ; pxor %xmm1,%xmm1
+ DB 131,251,1 ; cmp $0x1,%ebx
+ DB 15,132,43,254,255,255 ; je 4e3c <_sk_load_f16_dst_sse2+0x55>
+ DB 102,15,22,68,254,8 ; movhpd 0x8(%esi,%edi,8),%xmm0
+ DB 131,251,3 ; cmp $0x3,%ebx
+ DB 15,130,28,254,255,255 ; jb 4e3c <_sk_load_f16_dst_sse2+0x55>
+ DB 243,15,126,76,254,16 ; movq 0x10(%esi,%edi,8),%xmm1
+ DB 233,17,254,255,255 ; jmp 4e3c <_sk_load_f16_dst_sse2+0x55>
PUBLIC _sk_gather_f16_sse2
_sk_gather_f16_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 129,236,204,0,0,0 ; sub $0xcc,%esp
- DB 232,0,0,0,0 ; call 663b <_sk_gather_f16_sse2+0x11>
- DB 89 ; pop %ecx
+ DB 131,236,88 ; sub $0x58,%esp
DB 139,69,12 ; mov 0xc(%ebp),%eax
- DB 139,48 ; mov (%eax),%esi
- DB 139,22 ; mov (%esi),%edx
+ DB 139,16 ; mov (%eax),%edx
+ DB 139,10 ; mov (%edx),%ecx
DB 243,15,91,201 ; cvttps2dq %xmm1,%xmm1
- DB 102,15,110,86,4 ; movd 0x4(%esi),%xmm2
+ DB 102,15,110,82,4 ; movd 0x4(%edx),%xmm2
DB 102,15,112,210,0 ; pshufd $0x0,%xmm2,%xmm2
DB 102,15,112,217,245 ; pshufd $0xf5,%xmm1,%xmm3
DB 102,15,244,218 ; pmuludq %xmm2,%xmm3
@@ -44099,138 +42564,120 @@ _sk_gather_f16_sse2 LABEL PROC
DB 102,15,98,203 ; punpckldq %xmm3,%xmm1
DB 243,15,91,192 ; cvttps2dq %xmm0,%xmm0
DB 102,15,254,193 ; paddd %xmm1,%xmm0
- DB 102,15,126,198 ; movd %xmm0,%esi
- DB 102,15,112,200,229 ; pshufd $0xe5,%xmm0,%xmm1
- DB 102,15,112,208,78 ; pshufd $0x4e,%xmm0,%xmm2
- DB 102,15,112,192,231 ; pshufd $0xe7,%xmm0,%xmm0
- DB 102,15,126,199 ; movd %xmm0,%edi
- DB 102,15,110,68,250,4 ; movd 0x4(%edx,%edi,8),%xmm0
- DB 102,15,110,28,250 ; movd (%edx,%edi,8),%xmm3
- DB 102,15,126,215 ; movd %xmm2,%edi
- DB 102,15,110,84,250,4 ; movd 0x4(%edx,%edi,8),%xmm2
- DB 102,15,110,36,250 ; movd (%edx,%edi,8),%xmm4
- DB 102,15,126,207 ; movd %xmm1,%edi
- DB 102,15,98,208 ; punpckldq %xmm0,%xmm2
- DB 102,15,98,227 ; punpckldq %xmm3,%xmm4
- DB 102,15,98,226 ; punpckldq %xmm2,%xmm4
- DB 102,15,110,68,242,4 ; movd 0x4(%edx,%esi,8),%xmm0
- DB 102,15,110,76,250,4 ; movd 0x4(%edx,%edi,8),%xmm1
- DB 102,15,98,193 ; punpckldq %xmm1,%xmm0
- DB 102,15,110,12,242 ; movd (%edx,%esi,8),%xmm1
- DB 102,15,110,20,250 ; movd (%edx,%edi,8),%xmm2
+ DB 102,15,112,200,78 ; pshufd $0x4e,%xmm0,%xmm1
+ DB 102,15,112,208,231 ; pshufd $0xe7,%xmm0,%xmm2
+ DB 102,15,126,210 ; movd %xmm2,%edx
+ DB 102,15,110,84,209,4 ; movd 0x4(%ecx,%edx,8),%xmm2
+ DB 102,15,110,28,209 ; movd (%ecx,%edx,8),%xmm3
+ DB 102,15,126,202 ; movd %xmm1,%edx
+ DB 102,15,110,76,209,4 ; movd 0x4(%ecx,%edx,8),%xmm1
+ DB 102,15,110,36,209 ; movd (%ecx,%edx,8),%xmm4
+ DB 102,15,126,194 ; movd %xmm0,%edx
+ DB 102,15,112,192,229 ; pshufd $0xe5,%xmm0,%xmm0
+ DB 102,15,110,108,209,4 ; movd 0x4(%ecx,%edx,8),%xmm5
+ DB 102,15,110,52,209 ; movd (%ecx,%edx,8),%xmm6
+ DB 102,15,126,194 ; movd %xmm0,%edx
+ DB 102,15,110,68,209,4 ; movd 0x4(%ecx,%edx,8),%xmm0
+ DB 102,15,110,60,209 ; movd (%ecx,%edx,8),%xmm7
+ DB 232,0,0,0,0 ; call 50b9 <_sk_gather_f16_sse2+0x8e>
+ DB 89 ; pop %ecx
DB 102,15,98,202 ; punpckldq %xmm2,%xmm1
- DB 102,15,98,200 ; punpckldq %xmm0,%xmm1
- DB 102,15,111,193 ; movdqa %xmm1,%xmm0
+ DB 102,15,98,227 ; punpckldq %xmm3,%xmm4
+ DB 102,15,98,225 ; punpckldq %xmm1,%xmm4
+ DB 102,15,98,232 ; punpckldq %xmm0,%xmm5
+ DB 102,15,98,247 ; punpckldq %xmm7,%xmm6
+ DB 102,15,98,245 ; punpckldq %xmm5,%xmm6
+ DB 102,15,111,198 ; movdqa %xmm6,%xmm0
DB 102,15,97,196 ; punpcklwd %xmm4,%xmm0
- DB 102,15,105,204 ; punpckhwd %xmm4,%xmm1
+ DB 102,15,105,244 ; punpckhwd %xmm4,%xmm6
DB 102,15,111,208 ; movdqa %xmm0,%xmm2
- DB 102,15,97,209 ; punpcklwd %xmm1,%xmm2
- DB 102,15,105,193 ; punpckhwd %xmm1,%xmm0
- DB 102,15,126,85,208 ; movd %xmm2,-0x30(%ebp)
+ DB 102,15,97,214 ; punpcklwd %xmm6,%xmm2
+ DB 102,15,105,198 ; punpckhwd %xmm6,%xmm0
+ DB 102,15,126,85,224 ; movd %xmm2,-0x20(%ebp)
DB 102,15,112,202,229 ; pshufd $0xe5,%xmm2,%xmm1
- DB 102,15,126,77,212 ; movd %xmm1,-0x2c(%ebp)
- DB 243,15,126,101,208 ; movq -0x30(%ebp),%xmm4
+ DB 102,15,126,77,228 ; movd %xmm1,-0x1c(%ebp)
+ DB 243,15,126,77,224 ; movq -0x20(%ebp),%xmm1
DB 102,15,112,218,231 ; pshufd $0xe7,%xmm2,%xmm3
- DB 102,15,126,93,220 ; movd %xmm3,-0x24(%ebp)
+ DB 102,15,126,93,236 ; movd %xmm3,-0x14(%ebp)
DB 102,15,112,210,78 ; pshufd $0x4e,%xmm2,%xmm2
- DB 102,15,126,85,216 ; movd %xmm2,-0x28(%ebp)
- DB 243,15,126,85,216 ; movq -0x28(%ebp),%xmm2
- DB 102,15,126,69,224 ; movd %xmm0,-0x20(%ebp)
+ DB 102,15,126,85,232 ; movd %xmm2,-0x18(%ebp)
+ DB 243,15,126,125,232 ; movq -0x18(%ebp),%xmm7
+ DB 102,15,126,69,240 ; movd %xmm0,-0x10(%ebp)
DB 102,15,112,216,229 ; pshufd $0xe5,%xmm0,%xmm3
- DB 102,15,126,93,228 ; movd %xmm3,-0x1c(%ebp)
- DB 243,15,126,77,224 ; movq -0x20(%ebp),%xmm1
+ DB 102,15,126,93,244 ; movd %xmm3,-0xc(%ebp)
+ DB 243,15,126,109,240 ; movq -0x10(%ebp),%xmm5
DB 102,15,112,216,231 ; pshufd $0xe7,%xmm0,%xmm3
- DB 102,15,126,93,236 ; movd %xmm3,-0x14(%ebp)
+ DB 102,15,126,93,252 ; movd %xmm3,-0x4(%ebp)
DB 102,15,112,192,78 ; pshufd $0x4e,%xmm0,%xmm0
- DB 102,15,126,69,232 ; movd %xmm0,-0x18(%ebp)
- DB 102,15,239,219 ; pxor %xmm3,%xmm3
- DB 102,15,111,236 ; movdqa %xmm4,%xmm5
- DB 102,15,97,235 ; punpcklwd %xmm3,%xmm5
- DB 102,15,111,161,165,58,0,0 ; movdqa 0x3aa5(%ecx),%xmm4
- DB 102,15,111,197 ; movdqa %xmm5,%xmm0
- DB 102,15,219,196 ; pand %xmm4,%xmm0
- DB 102,15,239,232 ; pxor %xmm0,%xmm5
- DB 102,15,127,109,136 ; movdqa %xmm5,-0x78(%ebp)
- DB 102,15,114,240,16 ; pslld $0x10,%xmm0
- DB 102,15,114,245,13 ; pslld $0xd,%xmm5
- DB 102,15,235,232 ; por %xmm0,%xmm5
- DB 102,15,97,211 ; punpcklwd %xmm3,%xmm2
- DB 102,15,111,194 ; movdqa %xmm2,%xmm0
- DB 102,15,219,196 ; pand %xmm4,%xmm0
- DB 102,15,239,208 ; pxor %xmm0,%xmm2
- DB 102,15,127,85,152 ; movdqa %xmm2,-0x68(%ebp)
- DB 102,15,114,240,16 ; pslld $0x10,%xmm0
- DB 102,15,111,242 ; movdqa %xmm2,%xmm6
- DB 102,15,114,246,13 ; pslld $0xd,%xmm6
- DB 102,15,235,240 ; por %xmm0,%xmm6
- DB 102,15,97,203 ; punpcklwd %xmm3,%xmm1
- DB 102,15,111,193 ; movdqa %xmm1,%xmm0
- DB 102,15,219,196 ; pand %xmm4,%xmm0
- DB 102,15,239,200 ; pxor %xmm0,%xmm1
- DB 102,15,127,77,168 ; movdqa %xmm1,-0x58(%ebp)
- DB 102,15,114,240,16 ; pslld $0x10,%xmm0
- DB 102,15,111,249 ; movdqa %xmm1,%xmm7
- DB 102,15,114,247,13 ; pslld $0xd,%xmm7
- DB 102,15,235,248 ; por %xmm0,%xmm7
- DB 243,15,126,69,232 ; movq -0x18(%ebp),%xmm0
- DB 102,15,97,195 ; punpcklwd %xmm3,%xmm0
- DB 102,15,219,224 ; pand %xmm0,%xmm4
- DB 102,15,239,196 ; pxor %xmm4,%xmm0
+ DB 102,15,126,69,248 ; movd %xmm0,-0x8(%ebp)
+ DB 102,15,239,192 ; pxor %xmm0,%xmm0
+ DB 102,15,97,200 ; punpcklwd %xmm0,%xmm1
+ DB 102,15,111,153,71,45,0,0 ; movdqa 0x2d47(%ecx),%xmm3
+ DB 102,15,111,225 ; movdqa %xmm1,%xmm4
+ DB 102,15,219,227 ; pand %xmm3,%xmm4
+ DB 102,15,239,204 ; pxor %xmm4,%xmm1
DB 102,15,114,244,16 ; pslld $0x10,%xmm4
- DB 102,15,111,200 ; movdqa %xmm0,%xmm1
- DB 102,15,114,241,13 ; pslld $0xd,%xmm1
- DB 102,15,235,204 ; por %xmm4,%xmm1
- DB 102,15,111,153,181,58,0,0 ; movdqa 0x3ab5(%ecx),%xmm3
- DB 102,15,254,235 ; paddd %xmm3,%xmm5
+ DB 102,15,111,209 ; movdqa %xmm1,%xmm2
+ DB 102,15,114,242,13 ; pslld $0xd,%xmm2
+ DB 102,15,235,212 ; por %xmm4,%xmm2
+ DB 102,15,97,248 ; punpcklwd %xmm0,%xmm7
+ DB 102,15,111,231 ; movdqa %xmm7,%xmm4
+ DB 102,15,219,227 ; pand %xmm3,%xmm4
+ DB 102,15,239,252 ; pxor %xmm4,%xmm7
+ DB 102,15,127,125,168 ; movdqa %xmm7,-0x58(%ebp)
+ DB 102,15,114,244,16 ; pslld $0x10,%xmm4
+ DB 102,15,111,247 ; movdqa %xmm7,%xmm6
+ DB 102,15,114,246,13 ; pslld $0xd,%xmm6
+ DB 102,15,235,244 ; por %xmm4,%xmm6
+ DB 102,15,97,232 ; punpcklwd %xmm0,%xmm5
+ DB 102,15,111,253 ; movdqa %xmm5,%xmm7
+ DB 102,15,219,251 ; pand %xmm3,%xmm7
+ DB 102,15,239,239 ; pxor %xmm7,%xmm5
+ DB 102,15,127,109,184 ; movdqa %xmm5,-0x48(%ebp)
+ DB 102,15,114,247,16 ; pslld $0x10,%xmm7
+ DB 102,15,114,245,13 ; pslld $0xd,%xmm5
+ DB 102,15,235,239 ; por %xmm7,%xmm5
+ DB 243,15,126,125,248 ; movq -0x8(%ebp),%xmm7
+ DB 102,15,97,248 ; punpcklwd %xmm0,%xmm7
+ DB 102,15,219,223 ; pand %xmm7,%xmm3
+ DB 102,15,239,251 ; pxor %xmm3,%xmm7
+ DB 102,15,114,243,16 ; pslld $0x10,%xmm3
+ DB 102,15,111,199 ; movdqa %xmm7,%xmm0
+ DB 102,15,114,240,13 ; pslld $0xd,%xmm0
+ DB 102,15,235,195 ; por %xmm3,%xmm0
+ DB 102,15,111,153,87,45,0,0 ; movdqa 0x2d57(%ecx),%xmm3
+ DB 102,15,254,211 ; paddd %xmm3,%xmm2
DB 102,15,254,243 ; paddd %xmm3,%xmm6
- DB 102,15,254,251 ; paddd %xmm3,%xmm7
- DB 102,15,254,203 ; paddd %xmm3,%xmm1
- DB 102,15,111,153,197,58,0,0 ; movdqa 0x3ac5(%ecx),%xmm3
- DB 102,15,127,93,184 ; movdqa %xmm3,-0x48(%ebp)
- DB 102,15,111,85,136 ; movdqa -0x78(%ebp),%xmm2
- DB 102,15,239,211 ; pxor %xmm3,%xmm2
- DB 102,15,111,153,213,58,0,0 ; movdqa 0x3ad5(%ecx),%xmm3
+ DB 102,15,254,235 ; paddd %xmm3,%xmm5
+ DB 102,15,254,195 ; paddd %xmm3,%xmm0
+ DB 102,15,111,153,103,45,0,0 ; movdqa 0x2d67(%ecx),%xmm3
+ DB 102,15,127,93,200 ; movdqa %xmm3,-0x38(%ebp)
+ DB 102,15,239,203 ; pxor %xmm3,%xmm1
+ DB 102,15,111,153,119,45,0,0 ; movdqa 0x2d77(%ecx),%xmm3
DB 102,15,111,227 ; movdqa %xmm3,%xmm4
- DB 102,15,102,226 ; pcmpgtd %xmm2,%xmm4
- DB 102,15,223,229 ; pandn %xmm5,%xmm4
- DB 102,15,111,85,152 ; movdqa -0x68(%ebp),%xmm2
- DB 102,15,239,85,184 ; pxor -0x48(%ebp),%xmm2
- DB 102,15,111,235 ; movdqa %xmm3,%xmm5
- DB 102,15,102,234 ; pcmpgtd %xmm2,%xmm5
- DB 102,15,223,238 ; pandn %xmm6,%xmm5
- DB 102,15,111,117,168 ; movdqa -0x58(%ebp),%xmm6
- DB 102,15,239,117,184 ; pxor -0x48(%ebp),%xmm6
+ DB 102,15,102,225 ; pcmpgtd %xmm1,%xmm4
+ DB 102,15,223,226 ; pandn %xmm2,%xmm4
+ DB 102,15,111,85,168 ; movdqa -0x58(%ebp),%xmm2
+ DB 102,15,239,85,200 ; pxor -0x38(%ebp),%xmm2
+ DB 102,15,111,203 ; movdqa %xmm3,%xmm1
+ DB 102,15,102,202 ; pcmpgtd %xmm2,%xmm1
+ DB 102,15,223,206 ; pandn %xmm6,%xmm1
+ DB 102,15,111,117,184 ; movdqa -0x48(%ebp),%xmm6
+ DB 102,15,239,117,200 ; pxor -0x38(%ebp),%xmm6
DB 102,15,111,211 ; movdqa %xmm3,%xmm2
DB 102,15,102,214 ; pcmpgtd %xmm6,%xmm2
+ DB 102,15,223,213 ; pandn %xmm5,%xmm2
+ DB 102,15,239,125,200 ; pxor -0x38(%ebp),%xmm7
+ DB 102,15,102,223 ; pcmpgtd %xmm7,%xmm3
+ DB 102,15,223,216 ; pandn %xmm0,%xmm3
DB 139,77,8 ; mov 0x8(%ebp),%ecx
- DB 139,85,16 ; mov 0x10(%ebp),%edx
- DB 139,117,20 ; mov 0x14(%ebp),%esi
- DB 139,125,24 ; mov 0x18(%ebp),%edi
- DB 102,15,223,215 ; pandn %xmm7,%xmm2
- DB 15,40,117,40 ; movaps 0x28(%ebp),%xmm6
- DB 102,15,239,69,184 ; pxor -0x48(%ebp),%xmm0
- DB 15,40,125,56 ; movaps 0x38(%ebp),%xmm7
- DB 102,15,102,216 ; pcmpgtd %xmm0,%xmm3
- DB 15,40,69,72 ; movaps 0x48(%ebp),%xmm0
- DB 102,15,223,217 ; pandn %xmm1,%xmm3
- DB 15,40,77,88 ; movaps 0x58(%ebp),%xmm1
- DB 141,88,8 ; lea 0x8(%eax),%ebx
- DB 15,41,76,36,80 ; movaps %xmm1,0x50(%esp)
- DB 15,41,68,36,64 ; movaps %xmm0,0x40(%esp)
- DB 15,41,124,36,48 ; movaps %xmm7,0x30(%esp)
- DB 15,41,116,36,32 ; movaps %xmm6,0x20(%esp)
- DB 137,124,36,16 ; mov %edi,0x10(%esp)
- DB 137,116,36,12 ; mov %esi,0xc(%esp)
- DB 137,84,36,8 ; mov %edx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,12,36 ; mov %ecx,(%esp)
+ DB 141,80,8 ; lea 0x8(%eax),%edx
+ DB 131,236,8 ; sub $0x8,%esp
DB 102,15,111,196 ; movdqa %xmm4,%xmm0
- DB 102,15,111,205 ; movdqa %xmm5,%xmm1
+ DB 82 ; push %edx
+ DB 81 ; push %ecx
DB 255,80,4 ; call *0x4(%eax)
- DB 129,196,204,0,0,0 ; add $0xcc,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 131,196,104 ; add $0x68,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -44238,35 +42685,34 @@ PUBLIC _sk_store_f16_sse2
_sk_store_f16_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
DB 87 ; push %edi
DB 86 ; push %esi
- DB 129,236,188,0,0,0 ; sub $0xbc,%esp
- DB 15,41,93,200 ; movaps %xmm3,-0x38(%ebp)
+ DB 131,236,80 ; sub $0x50,%esp
+ DB 15,41,93,216 ; movaps %xmm3,-0x28(%ebp)
DB 102,15,111,218 ; movdqa %xmm2,%xmm3
- DB 232,0,0,0,0 ; call 68d8 <_sk_store_f16_sse2+0x19>
+ DB 232,0,0,0,0 ; call 527c <_sk_store_f16_sse2+0x15>
DB 88 ; pop %eax
- DB 102,15,111,176,72,56,0,0 ; movdqa 0x3848(%eax),%xmm6
+ DB 102,15,111,176,196,43,0,0 ; movdqa 0x2bc4(%eax),%xmm6
DB 102,15,111,208 ; movdqa %xmm0,%xmm2
DB 102,15,219,214 ; pand %xmm6,%xmm2
- DB 102,15,127,69,184 ; movdqa %xmm0,-0x48(%ebp)
+ DB 102,15,127,69,200 ; movdqa %xmm0,-0x38(%ebp)
DB 102,15,111,232 ; movdqa %xmm0,%xmm5
DB 102,15,239,234 ; pxor %xmm2,%xmm5
- DB 102,15,111,160,88,56,0,0 ; movdqa 0x3858(%eax),%xmm4
+ DB 102,15,111,160,212,43,0,0 ; movdqa 0x2bd4(%eax),%xmm4
DB 102,15,114,210,16 ; psrld $0x10,%xmm2
DB 102,15,111,196 ; movdqa %xmm4,%xmm0
DB 102,15,102,197 ; pcmpgtd %xmm5,%xmm0
DB 102,15,114,213,13 ; psrld $0xd,%xmm5
- DB 102,15,111,184,104,56,0,0 ; movdqa 0x3868(%eax),%xmm7
+ DB 102,15,111,184,228,43,0,0 ; movdqa 0x2be4(%eax),%xmm7
DB 102,15,254,215 ; paddd %xmm7,%xmm2
- DB 102,15,127,125,216 ; movdqa %xmm7,-0x28(%ebp)
+ DB 102,15,127,125,232 ; movdqa %xmm7,-0x18(%ebp)
DB 102,15,254,213 ; paddd %xmm5,%xmm2
DB 102,15,114,242,16 ; pslld $0x10,%xmm2
DB 102,15,114,226,16 ; psrad $0x10,%xmm2
DB 102,15,223,194 ; pandn %xmm2,%xmm0
DB 102,15,111,233 ; movdqa %xmm1,%xmm5
DB 102,15,219,238 ; pand %xmm6,%xmm5
- DB 102,15,127,77,168 ; movdqa %xmm1,-0x58(%ebp)
+ DB 102,15,127,77,184 ; movdqa %xmm1,-0x48(%ebp)
DB 102,15,239,205 ; pxor %xmm5,%xmm1
DB 102,15,114,213,16 ; psrld $0x10,%xmm5
DB 102,15,111,212 ; movdqa %xmm4,%xmm2
@@ -44279,15 +42725,15 @@ _sk_store_f16_sse2 LABEL PROC
DB 102,15,223,213 ; pandn %xmm5,%xmm2
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,15,219,206 ; pand %xmm6,%xmm1
- DB 102,15,127,93,152 ; movdqa %xmm3,-0x68(%ebp)
+ DB 102,15,127,93,168 ; movdqa %xmm3,-0x58(%ebp)
DB 102,15,239,217 ; pxor %xmm1,%xmm3
DB 102,15,114,209,16 ; psrld $0x10,%xmm1
DB 102,15,111,236 ; movdqa %xmm4,%xmm5
DB 102,15,102,235 ; pcmpgtd %xmm3,%xmm5
DB 102,15,114,211,13 ; psrld $0xd,%xmm3
- DB 102,15,254,77,216 ; paddd -0x28(%ebp),%xmm1
+ DB 102,15,254,77,232 ; paddd -0x18(%ebp),%xmm1
DB 102,15,254,203 ; paddd %xmm3,%xmm1
- DB 102,15,111,93,200 ; movdqa -0x38(%ebp),%xmm3
+ DB 102,15,111,93,216 ; movdqa -0x28(%ebp),%xmm3
DB 102,15,114,241,16 ; pslld $0x10,%xmm1
DB 102,15,114,225,16 ; psrad $0x10,%xmm1
DB 102,15,223,233 ; pandn %xmm1,%xmm5
@@ -44295,69 +42741,60 @@ _sk_store_f16_sse2 LABEL PROC
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,15,239,206 ; pxor %xmm6,%xmm1
DB 102,15,114,214,16 ; psrld $0x10,%xmm6
- DB 102,15,254,117,216 ; paddd -0x28(%ebp),%xmm6
+ DB 102,15,254,117,232 ; paddd -0x18(%ebp),%xmm6
DB 102,15,102,225 ; pcmpgtd %xmm1,%xmm4
DB 102,15,114,209,13 ; psrld $0xd,%xmm1
DB 102,15,254,241 ; paddd %xmm1,%xmm6
+ DB 102,15,111,200 ; movdqa %xmm0,%xmm1
DB 102,15,114,246,16 ; pslld $0x10,%xmm6
DB 102,15,114,230,16 ; psrad $0x10,%xmm6
DB 102,15,223,230 ; pandn %xmm6,%xmm4
- DB 102,15,107,192 ; packssdw %xmm0,%xmm0
+ DB 102,15,107,201 ; packssdw %xmm1,%xmm1
DB 102,15,107,210 ; packssdw %xmm2,%xmm2
- DB 102,15,97,194 ; punpcklwd %xmm2,%xmm0
- DB 15,40,85,88 ; movaps 0x58(%ebp),%xmm2
+ DB 102,15,97,202 ; punpcklwd %xmm2,%xmm1
DB 102,15,107,237 ; packssdw %xmm5,%xmm5
DB 102,15,107,228 ; packssdw %xmm4,%xmm4
DB 102,15,97,236 ; punpcklwd %xmm4,%xmm5
- DB 15,40,125,72 ; movaps 0x48(%ebp),%xmm7
- DB 139,85,24 ; mov 0x18(%ebp),%edx
- DB 139,77,20 ; mov 0x14(%ebp),%ecx
DB 139,69,12 ; mov 0xc(%ebp),%eax
- DB 139,48 ; mov (%eax),%esi
- DB 139,94,4 ; mov 0x4(%esi),%ebx
- DB 15,175,217 ; imul %ecx,%ebx
- DB 193,227,3 ; shl $0x3,%ebx
- DB 3,30 ; add (%esi),%ebx
- DB 139,125,16 ; mov 0x10(%ebp),%edi
- DB 133,210 ; test %edx,%edx
- DB 139,117,8 ; mov 0x8(%ebp),%esi
- DB 15,40,117,56 ; movaps 0x38(%ebp),%xmm6
- DB 15,40,101,40 ; movaps 0x28(%ebp),%xmm4
- DB 102,15,111,200 ; movdqa %xmm0,%xmm1
- DB 102,15,98,205 ; punpckldq %xmm5,%xmm1
- DB 117,82 ; jne 6a7e <_sk_store_f16_sse2+0x1bf>
- DB 15,17,12,251 ; movups %xmm1,(%ebx,%edi,8)
- DB 102,15,106,197 ; punpckhdq %xmm5,%xmm0
- DB 243,15,127,68,251,16 ; movdqu %xmm0,0x10(%ebx,%edi,8)
- DB 141,88,8 ; lea 0x8(%eax),%ebx
- DB 15,41,84,36,80 ; movaps %xmm2,0x50(%esp)
- DB 15,41,124,36,64 ; movaps %xmm7,0x40(%esp)
- DB 15,41,116,36,48 ; movaps %xmm6,0x30(%esp)
- DB 15,41,100,36,32 ; movaps %xmm4,0x20(%esp)
- DB 137,84,36,16 ; mov %edx,0x10(%esp)
- DB 137,76,36,12 ; mov %ecx,0xc(%esp)
- DB 137,124,36,8 ; mov %edi,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,52,36 ; mov %esi,(%esp)
- DB 15,40,69,184 ; movaps -0x48(%ebp),%xmm0
- DB 15,40,77,168 ; movaps -0x58(%ebp),%xmm1
- DB 15,40,85,152 ; movaps -0x68(%ebp),%xmm2
+ DB 139,77,8 ; mov 0x8(%ebp),%ecx
+ DB 139,17 ; mov (%ecx),%edx
+ DB 139,56 ; mov (%eax),%edi
+ DB 139,119,4 ; mov 0x4(%edi),%esi
+ DB 15,175,113,4 ; imul 0x4(%ecx),%esi
+ DB 193,230,3 ; shl $0x3,%esi
+ DB 3,55 ; add (%edi),%esi
+ DB 139,121,8 ; mov 0x8(%ecx),%edi
+ DB 133,255 ; test %edi,%edi
+ DB 117,53 ; jne 53ee <_sk_store_f16_sse2+0x187>
+ DB 102,15,111,193 ; movdqa %xmm1,%xmm0
+ DB 102,15,98,197 ; punpckldq %xmm5,%xmm0
+ DB 243,15,127,4,214 ; movdqu %xmm0,(%esi,%edx,8)
+ DB 102,15,106,205 ; punpckhdq %xmm5,%xmm1
+ DB 243,15,127,76,214,16 ; movdqu %xmm1,0x10(%esi,%edx,8)
+ DB 141,80,8 ; lea 0x8(%eax),%edx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 15,40,69,200 ; movaps -0x38(%ebp),%xmm0
+ DB 15,40,77,184 ; movaps -0x48(%ebp),%xmm1
+ DB 15,40,85,168 ; movaps -0x58(%ebp),%xmm2
+ DB 82 ; push %edx
+ DB 81 ; push %ecx
DB 255,80,4 ; call *0x4(%eax)
- DB 129,196,188,0,0,0 ; add $0xbc,%esp
+ DB 131,196,96 ; add $0x60,%esp
DB 94 ; pop %esi
DB 95 ; pop %edi
- DB 91 ; pop %ebx
DB 93 ; pop %ebp
DB 195 ; ret
- DB 102,15,214,12,251 ; movq %xmm1,(%ebx,%edi,8)
- DB 131,250,1 ; cmp $0x1,%edx
- DB 116,178 ; je 6a3a <_sk_store_f16_sse2+0x17b>
- DB 102,15,23,76,251,8 ; movhpd %xmm1,0x8(%ebx,%edi,8)
- DB 131,250,3 ; cmp $0x3,%edx
- DB 114,167 ; jb 6a3a <_sk_store_f16_sse2+0x17b>
- DB 102,15,106,197 ; punpckhdq %xmm5,%xmm0
- DB 102,15,214,68,251,16 ; movq %xmm0,0x10(%ebx,%edi,8)
- DB 235,155 ; jmp 6a3a <_sk_store_f16_sse2+0x17b>
+ DB 102,15,111,209 ; movdqa %xmm1,%xmm2
+ DB 102,15,98,213 ; punpckldq %xmm5,%xmm2
+ DB 102,15,214,20,214 ; movq %xmm2,(%esi,%edx,8)
+ DB 131,255,1 ; cmp $0x1,%edi
+ DB 116,208 ; je 53d0 <_sk_store_f16_sse2+0x169>
+ DB 102,15,23,84,214,8 ; movhpd %xmm2,0x8(%esi,%edx,8)
+ DB 131,255,3 ; cmp $0x3,%edi
+ DB 114,197 ; jb 53d0 <_sk_store_f16_sse2+0x169>
+ DB 102,15,106,205 ; punpckhdq %xmm5,%xmm1
+ DB 102,15,214,76,214,16 ; movq %xmm1,0x10(%esi,%edx,8)
+ DB 235,185 ; jmp 53d0 <_sk_store_f16_sse2+0x169>
PUBLIC _sk_load_u16_be_sse2
_sk_load_u16_be_sse2 LABEL PROC
@@ -44366,23 +42803,23 @@ _sk_load_u16_be_sse2 LABEL PROC
DB 83 ; push %ebx
DB 87 ; push %edi
DB 86 ; push %esi
- DB 129,236,140,0,0,0 ; sub $0x8c,%esp
- DB 232,0,0,0,0 ; call 6ab0 <_sk_load_u16_be_sse2+0x11>
- DB 91 ; pop %ebx
- DB 15,40,125,88 ; movaps 0x58(%ebp),%xmm7
+ DB 131,236,44 ; sub $0x2c,%esp
DB 139,69,12 ; mov 0xc(%ebp),%eax
- DB 139,8 ; mov (%eax),%ecx
- DB 139,81,4 ; mov 0x4(%ecx),%edx
- DB 15,175,85,20 ; imul 0x14(%ebp),%edx
- DB 1,210 ; add %edx,%edx
- DB 3,17 ; add (%ecx),%edx
- DB 139,125,24 ; mov 0x18(%ebp),%edi
- DB 133,255 ; test %edi,%edi
- DB 139,117,16 ; mov 0x10(%ebp),%esi
- DB 141,12,181,0,0,0,0 ; lea 0x0(,%esi,4),%ecx
- DB 15,133,66,1,0,0 ; jne 6c1c <_sk_load_u16_be_sse2+0x17d>
- DB 102,15,16,4,74 ; movupd (%edx,%ecx,2),%xmm0
- DB 243,15,111,76,74,16 ; movdqu 0x10(%edx,%ecx,2),%xmm1
+ DB 139,77,8 ; mov 0x8(%ebp),%ecx
+ DB 139,49 ; mov (%ecx),%esi
+ DB 139,16 ; mov (%eax),%edx
+ DB 139,122,4 ; mov 0x4(%edx),%edi
+ DB 15,175,121,4 ; imul 0x4(%ecx),%edi
+ DB 1,255 ; add %edi,%edi
+ DB 3,58 ; add (%edx),%edi
+ DB 139,89,8 ; mov 0x8(%ecx),%ebx
+ DB 193,230,2 ; shl $0x2,%esi
+ DB 133,219 ; test %ebx,%ebx
+ DB 232,0,0,0,0 ; call 5442 <_sk_load_u16_be_sse2+0x2b>
+ DB 90 ; pop %edx
+ DB 15,133,11,1,0,0 ; jne 5554 <_sk_load_u16_be_sse2+0x13d>
+ DB 102,15,16,4,119 ; movupd (%edi,%esi,2),%xmm0
+ DB 243,15,111,76,119,16 ; movdqu 0x10(%edi,%esi,2),%xmm1
DB 102,15,40,208 ; movapd %xmm0,%xmm2
DB 102,15,97,209 ; punpcklwd %xmm1,%xmm2
DB 102,15,105,193 ; punpckhwd %xmm1,%xmm0
@@ -44401,7 +42838,7 @@ _sk_load_u16_be_sse2 LABEL PROC
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 102,15,97,195 ; punpcklwd %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,40,163,160,54,0,0 ; movaps 0x36a0(%ebx),%xmm4
+ DB 15,40,162,46,42,0,0 ; movaps 0x2a2e(%edx),%xmm4
DB 15,89,196 ; mulps %xmm4,%xmm0
DB 102,15,111,205 ; movdqa %xmm5,%xmm1
DB 102,15,113,241,8 ; psllw $0x8,%xmm1
@@ -44437,37 +42874,26 @@ _sk_load_u16_be_sse2 LABEL PROC
DB 102,15,97,235 ; punpcklwd %xmm3,%xmm5
DB 15,91,221 ; cvtdq2ps %xmm5,%xmm3
DB 15,89,220 ; mulps %xmm4,%xmm3
- DB 141,72,8 ; lea 0x8(%eax),%ecx
- DB 15,41,124,36,80 ; movaps %xmm7,0x50(%esp)
- DB 15,40,101,72 ; movaps 0x48(%ebp),%xmm4
- DB 15,41,100,36,64 ; movaps %xmm4,0x40(%esp)
- DB 15,40,101,56 ; movaps 0x38(%ebp),%xmm4
- DB 15,41,100,36,48 ; movaps %xmm4,0x30(%esp)
- DB 15,40,101,40 ; movaps 0x28(%ebp),%xmm4
- DB 15,41,100,36,32 ; movaps %xmm4,0x20(%esp)
- DB 137,124,36,16 ; mov %edi,0x10(%esp)
- DB 139,85,20 ; mov 0x14(%ebp),%edx
- DB 137,84,36,12 ; mov %edx,0xc(%esp)
- DB 137,116,36,8 ; mov %esi,0x8(%esp)
- DB 137,76,36,4 ; mov %ecx,0x4(%esp)
- DB 139,77,8 ; mov 0x8(%ebp),%ecx
- DB 137,12,36 ; mov %ecx,(%esp)
+ DB 141,80,8 ; lea 0x8(%eax),%edx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 82 ; push %edx
+ DB 81 ; push %ecx
DB 255,80,4 ; call *0x4(%eax)
- DB 129,196,140,0,0,0 ; add $0x8c,%esp
+ DB 131,196,60 ; add $0x3c,%esp
DB 94 ; pop %esi
DB 95 ; pop %edi
DB 91 ; pop %ebx
DB 93 ; pop %ebp
DB 195 ; ret
- DB 242,15,16,4,74 ; movsd (%edx,%ecx,2),%xmm0
+ DB 242,15,16,4,119 ; movsd (%edi,%esi,2),%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
- DB 131,255,1 ; cmp $0x1,%edi
- DB 15,132,183,254,255,255 ; je 6ae5 <_sk_load_u16_be_sse2+0x46>
- DB 102,15,22,68,74,8 ; movhpd 0x8(%edx,%ecx,2),%xmm0
- DB 131,255,3 ; cmp $0x3,%edi
- DB 15,130,168,254,255,255 ; jb 6ae5 <_sk_load_u16_be_sse2+0x46>
- DB 243,15,126,76,74,16 ; movq 0x10(%edx,%ecx,2),%xmm1
- DB 233,157,254,255,255 ; jmp 6ae5 <_sk_load_u16_be_sse2+0x46>
+ DB 131,251,1 ; cmp $0x1,%ebx
+ DB 15,132,238,254,255,255 ; je 5454 <_sk_load_u16_be_sse2+0x3d>
+ DB 102,15,22,68,119,8 ; movhpd 0x8(%edi,%esi,2),%xmm0
+ DB 131,251,3 ; cmp $0x3,%ebx
+ DB 15,130,223,254,255,255 ; jb 5454 <_sk_load_u16_be_sse2+0x3d>
+ DB 243,15,126,76,119,16 ; movq 0x10(%edi,%esi,2),%xmm1
+ DB 233,212,254,255,255 ; jmp 5454 <_sk_load_u16_be_sse2+0x3d>
PUBLIC _sk_load_rgb_u16_be_sse2
_sk_load_rgb_u16_be_sse2 LABEL PROC
@@ -44476,34 +42902,32 @@ _sk_load_rgb_u16_be_sse2 LABEL PROC
DB 83 ; push %ebx
DB 87 ; push %edi
DB 86 ; push %esi
- DB 131,236,124 ; sub $0x7c,%esp
- DB 232,0,0,0,0 ; call 6c56 <_sk_load_rgb_u16_be_sse2+0xe>
- DB 88 ; pop %eax
- DB 15,40,117,88 ; movaps 0x58(%ebp),%xmm6
- DB 15,40,109,72 ; movaps 0x48(%ebp),%xmm5
- DB 139,77,12 ; mov 0xc(%ebp),%ecx
- DB 139,17 ; mov (%ecx),%edx
+ DB 131,236,28 ; sub $0x1c,%esp
+ DB 139,69,12 ; mov 0xc(%ebp),%eax
+ DB 139,77,8 ; mov 0x8(%ebp),%ecx
+ DB 139,121,8 ; mov 0x8(%ecx),%edi
+ DB 139,16 ; mov (%eax),%edx
DB 139,114,4 ; mov 0x4(%edx),%esi
- DB 15,175,117,20 ; imul 0x14(%ebp),%esi
+ DB 15,175,113,4 ; imul 0x4(%ecx),%esi
DB 1,246 ; add %esi,%esi
DB 3,50 ; add (%edx),%esi
- DB 139,93,24 ; mov 0x18(%ebp),%ebx
- DB 133,219 ; test %ebx,%ebx
- DB 139,125,16 ; mov 0x10(%ebp),%edi
- DB 141,20,127 ; lea (%edi,%edi,2),%edx
- DB 15,133,32,1,0,0 ; jne 6da0 <_sk_load_rgb_u16_be_sse2+0x158>
- DB 243,15,111,20,86 ; movdqu (%esi,%edx,2),%xmm2
- DB 243,15,111,124,86,8 ; movdqu 0x8(%esi,%edx,2),%xmm7
- DB 102,15,115,223,4 ; psrldq $0x4,%xmm7
+ DB 107,25,3 ; imul $0x3,(%ecx),%ebx
+ DB 133,255 ; test %edi,%edi
+ DB 232,0,0,0,0 ; call 55a9 <_sk_load_rgb_u16_be_sse2+0x29>
+ DB 90 ; pop %edx
+ DB 15,133,240,0,0,0 ; jne 56a0 <_sk_load_rgb_u16_be_sse2+0x120>
+ DB 243,15,111,20,94 ; movdqu (%esi,%ebx,2),%xmm2
+ DB 243,15,111,92,94,8 ; movdqu 0x8(%esi,%ebx,2),%xmm3
+ DB 102,15,115,219,4 ; psrldq $0x4,%xmm3
DB 102,15,111,194 ; movdqa %xmm2,%xmm0
DB 102,15,115,216,6 ; psrldq $0x6,%xmm0
- DB 102,15,111,207 ; movdqa %xmm7,%xmm1
+ DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,15,115,217,6 ; psrldq $0x6,%xmm1
- DB 102,15,97,215 ; punpcklwd %xmm7,%xmm2
+ DB 102,15,97,211 ; punpcklwd %xmm3,%xmm2
DB 102,15,97,193 ; punpcklwd %xmm1,%xmm0
DB 102,15,111,202 ; movdqa %xmm2,%xmm1
DB 102,15,97,200 ; punpcklwd %xmm0,%xmm1
- DB 102,15,112,217,78 ; pshufd $0x4e,%xmm1,%xmm3
+ DB 102,15,112,225,78 ; pshufd $0x4e,%xmm1,%xmm4
DB 102,15,105,208 ; punpckhwd %xmm0,%xmm2
DB 102,15,111,193 ; movdqa %xmm1,%xmm0
DB 102,15,113,240,8 ; psllw $0x8,%xmm0
@@ -44513,86 +42937,75 @@ _sk_load_rgb_u16_be_sse2 LABEL PROC
DB 102,15,112,193,229 ; pshufd $0xe5,%xmm1,%xmm0
DB 102,15,126,69,228 ; movd %xmm0,-0x1c(%ebp)
DB 243,15,126,69,224 ; movq -0x20(%ebp),%xmm0
- DB 102,15,239,255 ; pxor %xmm7,%xmm7
- DB 102,15,97,199 ; punpcklwd %xmm7,%xmm0
+ DB 102,15,239,219 ; pxor %xmm3,%xmm3
+ DB 102,15,97,195 ; punpcklwd %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,40,160,10,53,0,0 ; movaps 0x350a(%eax),%xmm4
- DB 15,89,196 ; mulps %xmm4,%xmm0
- DB 102,15,111,203 ; movdqa %xmm3,%xmm1
+ DB 15,40,170,215,40,0,0 ; movaps 0x28d7(%edx),%xmm5
+ DB 15,89,197 ; mulps %xmm5,%xmm0
+ DB 102,15,111,204 ; movdqa %xmm4,%xmm1
DB 102,15,113,241,8 ; psllw $0x8,%xmm1
- DB 102,15,113,211,8 ; psrlw $0x8,%xmm3
- DB 102,15,235,217 ; por %xmm1,%xmm3
- DB 102,15,126,93,216 ; movd %xmm3,-0x28(%ebp)
- DB 102,15,112,203,229 ; pshufd $0xe5,%xmm3,%xmm1
+ DB 102,15,113,212,8 ; psrlw $0x8,%xmm4
+ DB 102,15,235,225 ; por %xmm1,%xmm4
+ DB 102,15,126,101,216 ; movd %xmm4,-0x28(%ebp)
+ DB 102,15,112,204,229 ; pshufd $0xe5,%xmm4,%xmm1
DB 102,15,126,77,220 ; movd %xmm1,-0x24(%ebp)
DB 243,15,126,77,216 ; movq -0x28(%ebp),%xmm1
- DB 102,15,97,207 ; punpcklwd %xmm7,%xmm1
+ DB 102,15,97,203 ; punpcklwd %xmm3,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,204 ; mulps %xmm4,%xmm1
- DB 102,15,111,218 ; movdqa %xmm2,%xmm3
- DB 102,15,113,243,8 ; psllw $0x8,%xmm3
+ DB 15,89,205 ; mulps %xmm5,%xmm1
+ DB 102,15,111,226 ; movdqa %xmm2,%xmm4
+ DB 102,15,113,244,8 ; psllw $0x8,%xmm4
DB 102,15,113,210,8 ; psrlw $0x8,%xmm2
- DB 102,15,235,211 ; por %xmm3,%xmm2
+ DB 102,15,235,212 ; por %xmm4,%xmm2
DB 102,15,126,85,232 ; movd %xmm2,-0x18(%ebp)
DB 102,15,112,210,229 ; pshufd $0xe5,%xmm2,%xmm2
DB 102,15,126,85,236 ; movd %xmm2,-0x14(%ebp)
DB 243,15,126,85,232 ; movq -0x18(%ebp),%xmm2
- DB 102,15,97,215 ; punpcklwd %xmm7,%xmm2
+ DB 102,15,97,211 ; punpcklwd %xmm3,%xmm2
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,212 ; mulps %xmm4,%xmm2
- DB 141,81,8 ; lea 0x8(%ecx),%edx
- DB 15,41,116,36,80 ; movaps %xmm6,0x50(%esp)
- DB 15,41,108,36,64 ; movaps %xmm5,0x40(%esp)
- DB 15,40,93,56 ; movaps 0x38(%ebp),%xmm3
- DB 15,41,92,36,48 ; movaps %xmm3,0x30(%esp)
- DB 15,40,93,40 ; movaps 0x28(%ebp),%xmm3
- DB 15,41,92,36,32 ; movaps %xmm3,0x20(%esp)
- DB 137,92,36,16 ; mov %ebx,0x10(%esp)
- DB 139,117,20 ; mov 0x14(%ebp),%esi
- DB 137,116,36,12 ; mov %esi,0xc(%esp)
- DB 137,124,36,8 ; mov %edi,0x8(%esp)
- DB 137,84,36,4 ; mov %edx,0x4(%esp)
- DB 139,85,8 ; mov 0x8(%ebp),%edx
- DB 137,20,36 ; mov %edx,(%esp)
- DB 15,40,152,26,53,0,0 ; movaps 0x351a(%eax),%xmm3
- DB 255,81,4 ; call *0x4(%ecx)
- DB 131,196,124 ; add $0x7c,%esp
+ DB 15,89,213 ; mulps %xmm5,%xmm2
+ DB 141,112,8 ; lea 0x8(%eax),%esi
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 15,40,154,231,40,0,0 ; movaps 0x28e7(%edx),%xmm3
+ DB 86 ; push %esi
+ DB 81 ; push %ecx
+ DB 255,80,4 ; call *0x4(%eax)
+ DB 131,196,44 ; add $0x2c,%esp
DB 94 ; pop %esi
DB 95 ; pop %edi
DB 91 ; pop %ebx
DB 93 ; pop %ebp
DB 195 ; ret
- DB 102,15,110,20,86 ; movd (%esi,%edx,2),%xmm2
- DB 102,15,196,84,86,4,2 ; pinsrw $0x2,0x4(%esi,%edx,2),%xmm2
+ DB 102,15,110,20,94 ; movd (%esi,%ebx,2),%xmm2
+ DB 102,15,196,84,94,4,2 ; pinsrw $0x2,0x4(%esi,%ebx,2),%xmm2
DB 102,15,239,201 ; pxor %xmm1,%xmm1
- DB 131,251,1 ; cmp $0x1,%ebx
- DB 117,13 ; jne 6dc2 <_sk_load_rgb_u16_be_sse2+0x17a>
- DB 102,15,239,255 ; pxor %xmm7,%xmm7
+ DB 131,255,1 ; cmp $0x1,%edi
+ DB 117,13 ; jne 56c2 <_sk_load_rgb_u16_be_sse2+0x142>
+ DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 102,15,239,192 ; pxor %xmm0,%xmm0
- DB 233,224,254,255,255 ; jmp 6ca2 <_sk_load_rgb_u16_be_sse2+0x5a>
- DB 102,15,110,68,86,6 ; movd 0x6(%esi,%edx,2),%xmm0
- DB 102,15,196,68,86,10,2 ; pinsrw $0x2,0xa(%esi,%edx,2),%xmm0
+ DB 233,16,255,255,255 ; jmp 55d2 <_sk_load_rgb_u16_be_sse2+0x52>
+ DB 102,15,110,68,94,6 ; movd 0x6(%esi,%ebx,2),%xmm0
+ DB 102,15,196,68,94,10,2 ; pinsrw $0x2,0xa(%esi,%ebx,2),%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
- DB 131,251,3 ; cmp $0x3,%ebx
- DB 114,18 ; jb 6dea <_sk_load_rgb_u16_be_sse2+0x1a2>
- DB 102,15,110,124,86,12 ; movd 0xc(%esi,%edx,2),%xmm7
- DB 102,15,196,124,86,16,2 ; pinsrw $0x2,0x10(%esi,%edx,2),%xmm7
- DB 233,184,254,255,255 ; jmp 6ca2 <_sk_load_rgb_u16_be_sse2+0x5a>
- DB 102,15,239,255 ; pxor %xmm7,%xmm7
- DB 233,175,254,255,255 ; jmp 6ca2 <_sk_load_rgb_u16_be_sse2+0x5a>
+ DB 131,255,3 ; cmp $0x3,%edi
+ DB 114,18 ; jb 56ea <_sk_load_rgb_u16_be_sse2+0x16a>
+ DB 102,15,110,92,94,12 ; movd 0xc(%esi,%ebx,2),%xmm3
+ DB 102,15,196,92,94,16,2 ; pinsrw $0x2,0x10(%esi,%ebx,2),%xmm3
+ DB 233,232,254,255,255 ; jmp 55d2 <_sk_load_rgb_u16_be_sse2+0x52>
+ DB 102,15,239,219 ; pxor %xmm3,%xmm3
+ DB 233,223,254,255,255 ; jmp 55d2 <_sk_load_rgb_u16_be_sse2+0x52>
PUBLIC _sk_store_u16_be_sse2
_sk_store_u16_be_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
DB 87 ; push %edi
DB 86 ; push %esi
- DB 131,236,124 ; sub $0x7c,%esp
- DB 15,41,93,216 ; movaps %xmm3,-0x28(%ebp)
- DB 232,0,0,0,0 ; call 6e05 <_sk_store_u16_be_sse2+0x12>
+ DB 131,236,16 ; sub $0x10,%esp
+ DB 15,41,93,232 ; movaps %xmm3,-0x18(%ebp)
+ DB 232,0,0,0,0 ; call 5704 <_sk_store_u16_be_sse2+0x11>
DB 88 ; pop %eax
- DB 15,40,176,123,51,0,0 ; movaps 0x337b(%eax),%xmm6
+ DB 15,40,176,156,39,0,0 ; movaps 0x279c(%eax),%xmm6
DB 15,40,224 ; movaps %xmm0,%xmm4
DB 15,89,230 ; mulps %xmm6,%xmm4
DB 102,15,91,228 ; cvtps2dq %xmm4,%xmm4
@@ -44623,7 +43036,7 @@ _sk_store_u16_be_sse2 LABEL PROC
DB 102,15,113,243,8 ; psllw $0x8,%xmm3
DB 102,15,113,213,8 ; psrlw $0x8,%xmm5
DB 102,15,235,235 ; por %xmm3,%xmm5
- DB 15,89,117,216 ; mulps -0x28(%ebp),%xmm6
+ DB 15,89,117,232 ; mulps -0x18(%ebp),%xmm6
DB 102,15,91,222 ; cvtps2dq %xmm6,%xmm3
DB 102,15,114,243,16 ; pslld $0x10,%xmm3
DB 102,15,114,227,16 ; psrad $0x10,%xmm3
@@ -44634,158 +43047,131 @@ _sk_store_u16_be_sse2 LABEL PROC
DB 102,15,235,222 ; por %xmm6,%xmm3
DB 102,15,97,231 ; punpcklwd %xmm7,%xmm4
DB 102,15,97,235 ; punpcklwd %xmm3,%xmm5
- DB 139,85,24 ; mov 0x18(%ebp),%edx
- DB 139,77,20 ; mov 0x14(%ebp),%ecx
DB 139,69,12 ; mov 0xc(%ebp),%eax
- DB 139,48 ; mov (%eax),%esi
- DB 139,94,4 ; mov 0x4(%esi),%ebx
- DB 15,175,217 ; imul %ecx,%ebx
- DB 1,219 ; add %ebx,%ebx
- DB 3,30 ; add (%esi),%ebx
- DB 139,125,16 ; mov 0x10(%ebp),%edi
- DB 133,210 ; test %edx,%edx
- DB 141,52,189,0,0,0,0 ; lea 0x0(,%edi,4),%esi
- DB 15,40,125,56 ; movaps 0x38(%ebp),%xmm7
- DB 15,40,117,40 ; movaps 0x28(%ebp),%xmm6
+ DB 139,77,8 ; mov 0x8(%ebp),%ecx
+ DB 139,17 ; mov (%ecx),%edx
+ DB 139,56 ; mov (%eax),%edi
+ DB 139,119,4 ; mov 0x4(%edi),%esi
+ DB 15,175,113,4 ; imul 0x4(%ecx),%esi
+ DB 1,246 ; add %esi,%esi
+ DB 3,55 ; add (%edi),%esi
+ DB 139,121,8 ; mov 0x8(%ecx),%edi
+ DB 193,226,2 ; shl $0x2,%edx
+ DB 133,255 ; test %edi,%edi
+ DB 117,45 ; jne 5806 <_sk_store_u16_be_sse2+0x113>
DB 102,15,111,220 ; movdqa %xmm4,%xmm3
DB 102,15,98,221 ; punpckldq %xmm5,%xmm3
- DB 117,82 ; jne 6f40 <_sk_store_u16_be_sse2+0x14d>
- DB 15,17,28,115 ; movups %xmm3,(%ebx,%esi,2)
+ DB 243,15,127,28,86 ; movdqu %xmm3,(%esi,%edx,2)
DB 102,15,106,229 ; punpckhdq %xmm5,%xmm4
- DB 243,15,127,100,115,16 ; movdqu %xmm4,0x10(%ebx,%esi,2)
- DB 141,112,8 ; lea 0x8(%eax),%esi
- DB 15,40,93,88 ; movaps 0x58(%ebp),%xmm3
- DB 15,41,92,36,80 ; movaps %xmm3,0x50(%esp)
- DB 15,40,93,72 ; movaps 0x48(%ebp),%xmm3
- DB 15,41,92,36,64 ; movaps %xmm3,0x40(%esp)
- DB 15,41,124,36,48 ; movaps %xmm7,0x30(%esp)
- DB 15,41,116,36,32 ; movaps %xmm6,0x20(%esp)
- DB 137,84,36,16 ; mov %edx,0x10(%esp)
- DB 137,76,36,12 ; mov %ecx,0xc(%esp)
- DB 137,124,36,8 ; mov %edi,0x8(%esp)
- DB 137,116,36,4 ; mov %esi,0x4(%esp)
- DB 139,77,8 ; mov 0x8(%ebp),%ecx
- DB 137,12,36 ; mov %ecx,(%esp)
- DB 15,40,93,216 ; movaps -0x28(%ebp),%xmm3
+ DB 243,15,127,100,86,16 ; movdqu %xmm4,0x10(%esi,%edx,2)
+ DB 141,80,8 ; lea 0x8(%eax),%edx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 15,40,93,232 ; movaps -0x18(%ebp),%xmm3
+ DB 82 ; push %edx
+ DB 81 ; push %ecx
DB 255,80,4 ; call *0x4(%eax)
- DB 131,196,124 ; add $0x7c,%esp
+ DB 131,196,32 ; add $0x20,%esp
DB 94 ; pop %esi
DB 95 ; pop %edi
- DB 91 ; pop %ebx
DB 93 ; pop %ebp
DB 195 ; ret
- DB 102,15,214,28,115 ; movq %xmm3,(%ebx,%esi,2)
- DB 131,250,1 ; cmp $0x1,%edx
- DB 116,178 ; je 6efc <_sk_store_u16_be_sse2+0x109>
- DB 102,15,23,92,115,8 ; movhpd %xmm3,0x8(%ebx,%esi,2)
- DB 131,250,3 ; cmp $0x3,%edx
- DB 114,167 ; jb 6efc <_sk_store_u16_be_sse2+0x109>
+ DB 102,15,111,244 ; movdqa %xmm4,%xmm6
+ DB 102,15,98,245 ; punpckldq %xmm5,%xmm6
+ DB 102,15,214,52,86 ; movq %xmm6,(%esi,%edx,2)
+ DB 131,255,1 ; cmp $0x1,%edi
+ DB 116,216 ; je 57f0 <_sk_store_u16_be_sse2+0xfd>
+ DB 102,15,23,116,86,8 ; movhpd %xmm6,0x8(%esi,%edx,2)
+ DB 131,255,3 ; cmp $0x3,%edi
+ DB 114,205 ; jb 57f0 <_sk_store_u16_be_sse2+0xfd>
DB 102,15,106,229 ; punpckhdq %xmm5,%xmm4
- DB 102,15,214,100,115,16 ; movq %xmm4,0x10(%ebx,%esi,2)
- DB 235,155 ; jmp 6efc <_sk_store_u16_be_sse2+0x109>
+ DB 102,15,214,100,86,16 ; movq %xmm4,0x10(%esi,%edx,2)
+ DB 235,193 ; jmp 57f0 <_sk_store_u16_be_sse2+0xfd>
PUBLIC _sk_load_f32_sse2
_sk_load_f32_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
DB 87 ; push %edi
DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 15,40,125,88 ; movaps 0x58(%ebp),%xmm7
- DB 15,40,117,72 ; movaps 0x48(%ebp),%xmm6
- DB 139,85,20 ; mov 0x14(%ebp),%edx
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
DB 139,69,12 ; mov 0xc(%ebp),%eax
+ DB 139,77,8 ; mov 0x8(%ebp),%ecx
+ DB 139,57 ; mov (%ecx),%edi
DB 139,48 ; mov (%eax),%esi
- DB 139,94,4 ; mov 0x4(%esi),%ebx
- DB 15,175,218 ; imul %edx,%ebx
- DB 193,227,2 ; shl $0x2,%ebx
- DB 3,30 ; add (%esi),%ebx
- DB 137,206 ; mov %ecx,%esi
- DB 193,230,4 ; shl $0x4,%esi
- DB 15,16,44,30 ; movups (%esi,%ebx,1),%xmm5
- DB 139,125,24 ; mov 0x18(%ebp),%edi
+ DB 139,86,4 ; mov 0x4(%esi),%edx
+ DB 15,175,81,4 ; imul 0x4(%ecx),%edx
+ DB 193,226,2 ; shl $0x2,%edx
+ DB 3,22 ; add (%esi),%edx
+ DB 141,52,189,0,0,0,0 ; lea 0x0(,%edi,4),%esi
+ DB 193,231,4 ; shl $0x4,%edi
+ DB 15,16,36,23 ; movups (%edi,%edx,1),%xmm4
+ DB 139,121,8 ; mov 0x8(%ecx),%edi
DB 133,255 ; test %edi,%edi
- DB 141,52,141,0,0,0,0 ; lea 0x0(,%ecx,4),%esi
- DB 117,117 ; jne 7014 <_sk_load_f32_sse2+0xb3>
- DB 15,16,84,179,16 ; movups 0x10(%ebx,%esi,4),%xmm2
- DB 15,16,92,179,32 ; movups 0x20(%ebx,%esi,4),%xmm3
- DB 15,16,68,179,48 ; movups 0x30(%ebx,%esi,4),%xmm0
- DB 15,40,229 ; movaps %xmm5,%xmm4
- DB 15,20,226 ; unpcklps %xmm2,%xmm4
+ DB 117,71 ; jne 58a6 <_sk_load_f32_sse2+0x77>
+ DB 15,16,84,178,16 ; movups 0x10(%edx,%esi,4),%xmm2
+ DB 15,16,92,178,32 ; movups 0x20(%edx,%esi,4),%xmm3
+ DB 15,16,68,178,48 ; movups 0x30(%edx,%esi,4),%xmm0
+ DB 15,40,236 ; movaps %xmm4,%xmm5
+ DB 15,20,234 ; unpcklps %xmm2,%xmm5
DB 15,40,203 ; movaps %xmm3,%xmm1
DB 15,20,200 ; unpcklps %xmm0,%xmm1
- DB 15,21,234 ; unpckhps %xmm2,%xmm5
+ DB 15,21,226 ; unpckhps %xmm2,%xmm4
DB 15,21,216 ; unpckhps %xmm0,%xmm3
- DB 15,40,196 ; movaps %xmm4,%xmm0
+ DB 15,40,197 ; movaps %xmm5,%xmm0
DB 102,15,20,193 ; unpcklpd %xmm1,%xmm0
- DB 15,18,204 ; movhlps %xmm4,%xmm1
- DB 15,40,213 ; movaps %xmm5,%xmm2
+ DB 15,18,205 ; movhlps %xmm5,%xmm1
+ DB 15,40,212 ; movaps %xmm4,%xmm2
DB 102,15,20,211 ; unpcklpd %xmm3,%xmm2
- DB 15,18,221 ; movhlps %xmm5,%xmm3
- DB 141,112,8 ; lea 0x8(%eax),%esi
- DB 15,41,124,36,80 ; movaps %xmm7,0x50(%esp)
- DB 15,41,116,36,64 ; movaps %xmm6,0x40(%esp)
- DB 15,40,101,56 ; movaps 0x38(%ebp),%xmm4
- DB 15,41,100,36,48 ; movaps %xmm4,0x30(%esp)
- DB 15,40,101,40 ; movaps 0x28(%ebp),%xmm4
- DB 15,41,100,36,32 ; movaps %xmm4,0x20(%esp)
- DB 137,124,36,16 ; mov %edi,0x10(%esp)
- DB 137,84,36,12 ; mov %edx,0xc(%esp)
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,116,36,4 ; mov %esi,0x4(%esp)
- DB 139,77,8 ; mov 0x8(%ebp),%ecx
- DB 137,12,36 ; mov %ecx,(%esp)
+ DB 15,18,220 ; movhlps %xmm4,%xmm3
+ DB 141,80,8 ; lea 0x8(%eax),%edx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 82 ; push %edx
+ DB 81 ; push %ecx
DB 255,80,4 ; call *0x4(%eax)
- DB 131,196,108 ; add $0x6c,%esp
+ DB 131,196,16 ; add $0x10,%esp
DB 94 ; pop %esi
DB 95 ; pop %edi
- DB 91 ; pop %ebx
DB 93 ; pop %ebp
DB 195 ; ret
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 131,255,1 ; cmp $0x1,%edi
- DB 117,8 ; jne 7024 <_sk_load_f32_sse2+0xc3>
+ DB 117,8 ; jne 58b6 <_sk_load_f32_sse2+0x87>
DB 15,87,219 ; xorps %xmm3,%xmm3
DB 15,87,210 ; xorps %xmm2,%xmm2
- DB 235,138 ; jmp 6fae <_sk_load_f32_sse2+0x4d>
- DB 15,16,84,179,16 ; movups 0x10(%ebx,%esi,4),%xmm2
+ DB 235,184 ; jmp 586e <_sk_load_f32_sse2+0x3f>
+ DB 15,16,84,178,16 ; movups 0x10(%edx,%esi,4),%xmm2
DB 131,255,3 ; cmp $0x3,%edi
- DB 114,10 ; jb 7038 <_sk_load_f32_sse2+0xd7>
- DB 15,16,92,179,32 ; movups 0x20(%ebx,%esi,4),%xmm3
- DB 233,118,255,255,255 ; jmp 6fae <_sk_load_f32_sse2+0x4d>
+ DB 114,7 ; jb 58c7 <_sk_load_f32_sse2+0x98>
+ DB 15,16,92,178,32 ; movups 0x20(%edx,%esi,4),%xmm3
+ DB 235,167 ; jmp 586e <_sk_load_f32_sse2+0x3f>
DB 15,87,219 ; xorps %xmm3,%xmm3
- DB 233,110,255,255,255 ; jmp 6fae <_sk_load_f32_sse2+0x4d>
+ DB 235,162 ; jmp 586e <_sk_load_f32_sse2+0x3f>
PUBLIC _sk_load_f32_dst_sse2
_sk_load_f32_dst_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
DB 87 ; push %edi
DB 86 ; push %esi
- DB 129,236,140,0,0,0 ; sub $0x8c,%esp
- DB 15,41,93,200 ; movaps %xmm3,-0x38(%ebp)
- DB 15,41,85,216 ; movaps %xmm2,-0x28(%ebp)
- DB 139,85,20 ; mov 0x14(%ebp),%edx
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
+ DB 131,236,32 ; sub $0x20,%esp
+ DB 15,41,93,216 ; movaps %xmm3,-0x28(%ebp)
+ DB 15,41,85,232 ; movaps %xmm2,-0x18(%ebp)
DB 139,69,12 ; mov 0xc(%ebp),%eax
+ DB 139,77,8 ; mov 0x8(%ebp),%ecx
+ DB 139,57 ; mov (%ecx),%edi
DB 139,48 ; mov (%eax),%esi
- DB 139,94,4 ; mov 0x4(%esi),%ebx
- DB 15,175,218 ; imul %edx,%ebx
- DB 193,227,2 ; shl $0x2,%ebx
- DB 3,30 ; add (%esi),%ebx
- DB 137,206 ; mov %ecx,%esi
- DB 193,230,4 ; shl $0x4,%esi
- DB 15,16,52,30 ; movups (%esi,%ebx,1),%xmm6
- DB 139,125,24 ; mov 0x18(%ebp),%edi
+ DB 139,86,4 ; mov 0x4(%esi),%edx
+ DB 15,175,81,4 ; imul 0x4(%ecx),%edx
+ DB 193,226,2 ; shl $0x2,%edx
+ DB 3,22 ; add (%esi),%edx
+ DB 141,52,189,0,0,0,0 ; lea 0x0(,%edi,4),%esi
+ DB 193,231,4 ; shl $0x4,%edi
+ DB 15,16,52,23 ; movups (%edi,%edx,1),%xmm6
+ DB 139,121,8 ; mov 0x8(%ecx),%edi
DB 133,255 ; test %edi,%edi
- DB 141,52,141,0,0,0,0 ; lea 0x0(,%ecx,4),%esi
- DB 117,122 ; jne 70fb <_sk_load_f32_dst_sse2+0xbb>
- DB 15,16,124,179,16 ; movups 0x10(%ebx,%esi,4),%xmm7
- DB 15,16,92,179,32 ; movups 0x20(%ebx,%esi,4),%xmm3
- DB 15,16,84,179,48 ; movups 0x30(%ebx,%esi,4),%xmm2
+ DB 117,97 ; jne 5968 <_sk_load_f32_dst_sse2+0x9c>
+ DB 15,16,124,178,16 ; movups 0x10(%edx,%esi,4),%xmm7
+ DB 15,16,92,178,32 ; movups 0x20(%edx,%esi,4),%xmm3
+ DB 15,16,84,178,48 ; movups 0x30(%edx,%esi,4),%xmm2
DB 15,40,230 ; movaps %xmm6,%xmm4
DB 15,20,231 ; unpcklps %xmm7,%xmm4
DB 15,40,235 ; movaps %xmm3,%xmm5
@@ -44798,39 +43184,35 @@ _sk_load_f32_dst_sse2 LABEL PROC
DB 15,40,230 ; movaps %xmm6,%xmm4
DB 102,15,20,227 ; unpcklpd %xmm3,%xmm4
DB 15,18,222 ; movhlps %xmm6,%xmm3
- DB 141,112,8 ; lea 0x8(%eax),%esi
- DB 137,124,36,16 ; mov %edi,0x10(%esp)
- DB 137,84,36,12 ; mov %edx,0xc(%esp)
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,116,36,4 ; mov %esi,0x4(%esp)
- DB 139,77,8 ; mov 0x8(%ebp),%ecx
- DB 137,12,36 ; mov %ecx,(%esp)
- DB 15,41,92,36,80 ; movaps %xmm3,0x50(%esp)
- DB 102,15,41,100,36,64 ; movapd %xmm4,0x40(%esp)
- DB 15,41,108,36,48 ; movaps %xmm5,0x30(%esp)
- DB 102,15,41,84,36,32 ; movapd %xmm2,0x20(%esp)
- DB 15,40,85,216 ; movaps -0x28(%ebp),%xmm2
- DB 15,40,93,200 ; movaps -0x38(%ebp),%xmm3
+ DB 102,15,41,81,16 ; movapd %xmm2,0x10(%ecx)
+ DB 15,41,105,32 ; movaps %xmm5,0x20(%ecx)
+ DB 102,15,41,97,48 ; movapd %xmm4,0x30(%ecx)
+ DB 15,41,89,64 ; movaps %xmm3,0x40(%ecx)
+ DB 141,80,8 ; lea 0x8(%eax),%edx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 15,40,85,232 ; movaps -0x18(%ebp),%xmm2
+ DB 15,40,93,216 ; movaps -0x28(%ebp),%xmm3
+ DB 82 ; push %edx
+ DB 81 ; push %ecx
DB 255,80,4 ; call *0x4(%eax)
- DB 129,196,140,0,0,0 ; add $0x8c,%esp
+ DB 131,196,48 ; add $0x30,%esp
DB 94 ; pop %esi
DB 95 ; pop %edi
- DB 91 ; pop %ebx
DB 93 ; pop %ebp
DB 195 ; ret
DB 15,87,210 ; xorps %xmm2,%xmm2
DB 131,255,1 ; cmp $0x1,%edi
- DB 117,8 ; jne 710b <_sk_load_f32_dst_sse2+0xcb>
+ DB 117,8 ; jne 5978 <_sk_load_f32_dst_sse2+0xac>
DB 15,87,219 ; xorps %xmm3,%xmm3
DB 15,87,255 ; xorps %xmm7,%xmm7
- DB 235,133 ; jmp 7090 <_sk_load_f32_dst_sse2+0x50>
- DB 15,16,124,179,16 ; movups 0x10(%ebx,%esi,4),%xmm7
+ DB 235,158 ; jmp 5916 <_sk_load_f32_dst_sse2+0x4a>
+ DB 15,16,124,178,16 ; movups 0x10(%edx,%esi,4),%xmm7
DB 131,255,3 ; cmp $0x3,%edi
- DB 114,10 ; jb 711f <_sk_load_f32_dst_sse2+0xdf>
- DB 15,16,92,179,32 ; movups 0x20(%ebx,%esi,4),%xmm3
- DB 233,113,255,255,255 ; jmp 7090 <_sk_load_f32_dst_sse2+0x50>
+ DB 114,7 ; jb 5989 <_sk_load_f32_dst_sse2+0xbd>
+ DB 15,16,92,178,32 ; movups 0x20(%edx,%esi,4),%xmm3
+ DB 235,141 ; jmp 5916 <_sk_load_f32_dst_sse2+0x4a>
DB 15,87,219 ; xorps %xmm3,%xmm3
- DB 233,105,255,255,255 ; jmp 7090 <_sk_load_f32_dst_sse2+0x50>
+ DB 235,136 ; jmp 5916 <_sk_load_f32_dst_sse2+0x4a>
PUBLIC _sk_store_f32_sse2
_sk_store_f32_sse2 LABEL PROC
@@ -44839,113 +43221,78 @@ _sk_store_f32_sse2 LABEL PROC
DB 83 ; push %ebx
DB 87 ; push %edi
DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 15,40,234 ; movaps %xmm2,%xmm5
- DB 15,40,248 ; movaps %xmm0,%xmm7
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
+ DB 131,236,12 ; sub $0xc,%esp
DB 139,69,12 ; mov 0xc(%ebp),%eax
- DB 139,16 ; mov (%eax),%edx
- DB 139,114,4 ; mov 0x4(%edx),%esi
- DB 15,175,117,20 ; imul 0x14(%ebp),%esi
- DB 193,230,2 ; shl $0x2,%esi
- DB 3,50 ; add (%edx),%esi
- DB 137,202 ; mov %ecx,%edx
- DB 193,226,4 ; shl $0x4,%edx
- DB 15,40,247 ; movaps %xmm7,%xmm6
- DB 15,20,241 ; unpcklps %xmm1,%xmm6
- DB 15,40,229 ; movaps %xmm5,%xmm4
+ DB 139,77,8 ; mov 0x8(%ebp),%ecx
+ DB 139,25 ; mov (%ecx),%ebx
+ DB 139,48 ; mov (%eax),%esi
+ DB 139,86,4 ; mov 0x4(%esi),%edx
+ DB 15,175,81,4 ; imul 0x4(%ecx),%edx
+ DB 193,226,2 ; shl $0x2,%edx
+ DB 3,22 ; add (%esi),%edx
+ DB 141,52,157,0,0,0,0 ; lea 0x0(,%ebx,4),%esi
+ DB 193,227,4 ; shl $0x4,%ebx
+ DB 15,40,232 ; movaps %xmm0,%xmm5
+ DB 15,20,233 ; unpcklps %xmm1,%xmm5
+ DB 15,40,226 ; movaps %xmm2,%xmm4
DB 15,20,227 ; unpcklps %xmm3,%xmm4
- DB 15,40,198 ; movaps %xmm6,%xmm0
- DB 102,15,20,196 ; unpcklpd %xmm4,%xmm0
- DB 102,15,17,4,50 ; movupd %xmm0,(%edx,%esi,1)
- DB 139,125,24 ; mov 0x18(%ebp),%edi
- DB 15,40,199 ; movaps %xmm7,%xmm0
- DB 15,21,193 ; unpckhps %xmm1,%xmm0
- DB 15,21,211 ; unpckhps %xmm3,%xmm2
- DB 15,18,230 ; movhlps %xmm6,%xmm4
+ DB 15,40,245 ; movaps %xmm5,%xmm6
+ DB 102,15,20,244 ; unpcklpd %xmm4,%xmm6
+ DB 139,121,8 ; mov 0x8(%ecx),%edi
+ DB 102,15,17,52,19 ; movupd %xmm6,(%ebx,%edx,1)
DB 15,40,240 ; movaps %xmm0,%xmm6
- DB 102,15,20,242 ; unpcklpd %xmm2,%xmm6
+ DB 15,21,241 ; unpckhps %xmm1,%xmm6
+ DB 15,40,250 ; movaps %xmm2,%xmm7
+ DB 15,21,251 ; unpckhps %xmm3,%xmm7
+ DB 15,18,229 ; movhlps %xmm5,%xmm4
+ DB 15,40,238 ; movaps %xmm6,%xmm5
+ DB 102,15,20,239 ; unpcklpd %xmm7,%xmm5
DB 133,255 ; test %edi,%edi
- DB 139,93,8 ; mov 0x8(%ebp),%ebx
- DB 141,20,141,0,0,0,0 ; lea 0x0(,%ecx,4),%edx
- DB 117,99 ; jne 71ee <_sk_store_f32_sse2+0xc7>
- DB 102,15,21,194 ; unpckhpd %xmm2,%xmm0
- DB 15,17,100,150,16 ; movups %xmm4,0x10(%esi,%edx,4)
- DB 102,15,17,116,150,32 ; movupd %xmm6,0x20(%esi,%edx,4)
- DB 102,15,17,68,150,48 ; movupd %xmm0,0x30(%esi,%edx,4)
+ DB 117,40 ; jne 5a14 <_sk_store_f32_sse2+0x86>
+ DB 102,15,21,247 ; unpckhpd %xmm7,%xmm6
+ DB 15,17,100,178,16 ; movups %xmm4,0x10(%edx,%esi,4)
+ DB 102,15,17,108,178,32 ; movupd %xmm5,0x20(%edx,%esi,4)
+ DB 102,15,17,116,178,48 ; movupd %xmm6,0x30(%edx,%esi,4)
DB 141,80,8 ; lea 0x8(%eax),%edx
- DB 15,40,69,88 ; movaps 0x58(%ebp),%xmm0
- DB 15,41,68,36,80 ; movaps %xmm0,0x50(%esp)
- DB 15,40,69,72 ; movaps 0x48(%ebp),%xmm0
- DB 15,41,68,36,64 ; movaps %xmm0,0x40(%esp)
- DB 15,40,69,56 ; movaps 0x38(%ebp),%xmm0
- DB 15,41,68,36,48 ; movaps %xmm0,0x30(%esp)
- DB 15,40,69,40 ; movaps 0x28(%ebp),%xmm0
- DB 15,41,68,36,32 ; movaps %xmm0,0x20(%esp)
- DB 137,124,36,16 ; mov %edi,0x10(%esp)
- DB 139,117,20 ; mov 0x14(%ebp),%esi
- DB 137,116,36,12 ; mov %esi,0xc(%esp)
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,84,36,4 ; mov %edx,0x4(%esp)
- DB 137,28,36 ; mov %ebx,(%esp)
- DB 15,40,199 ; movaps %xmm7,%xmm0
- DB 15,40,213 ; movaps %xmm5,%xmm2
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 82 ; push %edx
+ DB 81 ; push %ecx
DB 255,80,4 ; call *0x4(%eax)
- DB 131,196,108 ; add $0x6c,%esp
+ DB 131,196,28 ; add $0x1c,%esp
DB 94 ; pop %esi
DB 95 ; pop %edi
DB 91 ; pop %ebx
DB 93 ; pop %ebp
DB 195 ; ret
DB 131,255,1 ; cmp $0x1,%edi
- DB 116,173 ; je 71a0 <_sk_store_f32_sse2+0x79>
- DB 15,17,100,150,16 ; movups %xmm4,0x10(%esi,%edx,4)
+ DB 116,232 ; je 5a01 <_sk_store_f32_sse2+0x73>
+ DB 15,17,100,178,16 ; movups %xmm4,0x10(%edx,%esi,4)
DB 131,255,3 ; cmp $0x3,%edi
- DB 114,163 ; jb 71a0 <_sk_store_f32_sse2+0x79>
- DB 102,15,17,116,150,32 ; movupd %xmm6,0x20(%esi,%edx,4)
- DB 235,155 ; jmp 71a0 <_sk_store_f32_sse2+0x79>
+ DB 114,222 ; jb 5a01 <_sk_store_f32_sse2+0x73>
+ DB 102,15,17,108,178,32 ; movupd %xmm5,0x20(%edx,%esi,4)
+ DB 235,214 ; jmp 5a01 <_sk_store_f32_sse2+0x73>
PUBLIC _sk_clamp_x_sse2
_sk_clamp_x_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
- DB 139,85,20 ; mov 0x14(%ebp),%edx
- DB 139,117,12 ; mov 0xc(%ebp),%esi
- DB 139,62 ; mov (%esi),%edi
- DB 243,15,16,47 ; movss (%edi),%xmm5
- DB 139,125,24 ; mov 0x18(%ebp),%edi
- DB 15,40,117,40 ; movaps 0x28(%ebp),%xmm6
- DB 15,40,125,56 ; movaps 0x38(%ebp),%xmm7
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 139,69,12 ; mov 0xc(%ebp),%eax
+ DB 139,8 ; mov (%eax),%ecx
DB 15,87,228 ; xorps %xmm4,%xmm4
DB 15,95,224 ; maxps %xmm0,%xmm4
- DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
- DB 102,15,118,192 ; pcmpeqd %xmm0,%xmm0
- DB 102,15,254,197 ; paddd %xmm5,%xmm0
- DB 15,40,109,72 ; movaps 0x48(%ebp),%xmm5
- DB 15,93,224 ; minps %xmm0,%xmm4
- DB 15,40,69,88 ; movaps 0x58(%ebp),%xmm0
- DB 141,94,8 ; lea 0x8(%esi),%ebx
- DB 15,41,68,36,80 ; movaps %xmm0,0x50(%esp)
- DB 15,41,108,36,64 ; movaps %xmm5,0x40(%esp)
- DB 15,41,124,36,48 ; movaps %xmm7,0x30(%esp)
- DB 15,41,116,36,32 ; movaps %xmm6,0x20(%esp)
- DB 137,124,36,16 ; mov %edi,0x10(%esp)
- DB 137,84,36,12 ; mov %edx,0xc(%esp)
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
+ DB 243,15,16,1 ; movss (%ecx),%xmm0
+ DB 15,198,192,0 ; shufps $0x0,%xmm0,%xmm0
+ DB 102,15,118,237 ; pcmpeqd %xmm5,%xmm5
+ DB 102,15,254,232 ; paddd %xmm0,%xmm5
+ DB 15,93,229 ; minps %xmm5,%xmm4
+ DB 141,72,8 ; lea 0x8(%eax),%ecx
+ DB 131,236,8 ; sub $0x8,%esp
DB 15,40,196 ; movaps %xmm4,%xmm0
- DB 255,86,4 ; call *0x4(%esi)
- DB 131,196,108 ; add $0x6c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 81 ; push %ecx
+ DB 255,117,8 ; pushl 0x8(%ebp)
+ DB 255,80,4 ; call *0x4(%eax)
+ DB 131,196,24 ; add $0x18,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -44953,43 +43300,23 @@ PUBLIC _sk_clamp_y_sse2
_sk_clamp_y_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
- DB 139,85,20 ; mov 0x14(%ebp),%edx
- DB 139,117,12 ; mov 0xc(%ebp),%esi
- DB 139,62 ; mov (%esi),%edi
- DB 243,15,16,47 ; movss (%edi),%xmm5
- DB 139,125,24 ; mov 0x18(%ebp),%edi
- DB 15,40,117,40 ; movaps 0x28(%ebp),%xmm6
- DB 15,40,125,56 ; movaps 0x38(%ebp),%xmm7
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 139,69,12 ; mov 0xc(%ebp),%eax
+ DB 139,8 ; mov (%eax),%ecx
DB 15,87,228 ; xorps %xmm4,%xmm4
DB 15,95,225 ; maxps %xmm1,%xmm4
- DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
- DB 102,15,118,201 ; pcmpeqd %xmm1,%xmm1
- DB 102,15,254,205 ; paddd %xmm5,%xmm1
- DB 15,40,109,72 ; movaps 0x48(%ebp),%xmm5
- DB 15,93,225 ; minps %xmm1,%xmm4
- DB 15,40,77,88 ; movaps 0x58(%ebp),%xmm1
- DB 141,94,8 ; lea 0x8(%esi),%ebx
- DB 15,41,76,36,80 ; movaps %xmm1,0x50(%esp)
- DB 15,41,108,36,64 ; movaps %xmm5,0x40(%esp)
- DB 15,41,124,36,48 ; movaps %xmm7,0x30(%esp)
- DB 15,41,116,36,32 ; movaps %xmm6,0x20(%esp)
- DB 137,124,36,16 ; mov %edi,0x10(%esp)
- DB 137,84,36,12 ; mov %edx,0xc(%esp)
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
+ DB 243,15,16,9 ; movss (%ecx),%xmm1
+ DB 15,198,201,0 ; shufps $0x0,%xmm1,%xmm1
+ DB 102,15,118,237 ; pcmpeqd %xmm5,%xmm5
+ DB 102,15,254,233 ; paddd %xmm1,%xmm5
+ DB 15,93,229 ; minps %xmm5,%xmm4
+ DB 141,72,8 ; lea 0x8(%eax),%ecx
+ DB 131,236,8 ; sub $0x8,%esp
DB 15,40,204 ; movaps %xmm4,%xmm1
- DB 255,86,4 ; call *0x4(%esi)
- DB 131,196,108 ; add $0x6c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 81 ; push %ecx
+ DB 255,117,8 ; pushl 0x8(%ebp)
+ DB 255,80,4 ; call *0x4(%eax)
+ DB 131,196,24 ; add $0x18,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -44997,52 +43324,32 @@ PUBLIC _sk_repeat_x_sse2
_sk_repeat_x_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 232,0,0,0,0 ; call 7309 <_sk_repeat_x_sse2+0xe>
- DB 94 ; pop %esi
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
- DB 139,85,12 ; mov 0xc(%ebp),%edx
- DB 139,58 ; mov (%edx),%edi
- DB 243,15,16,39 ; movss (%edi),%xmm4
- DB 243,15,16,111,4 ; movss 0x4(%edi),%xmm5
- DB 139,125,20 ; mov 0x14(%ebp),%edi
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 232,0,0,0,0 ; call 5aa8 <_sk_repeat_x_sse2+0xb>
+ DB 89 ; pop %ecx
+ DB 139,69,12 ; mov 0xc(%ebp),%eax
+ DB 139,16 ; mov (%eax),%edx
+ DB 243,15,16,34 ; movss (%edx),%xmm4
+ DB 243,15,16,106,4 ; movss 0x4(%edx),%xmm5
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
DB 15,89,232 ; mulps %xmm0,%xmm5
DB 243,15,91,245 ; cvttps2dq %xmm5,%xmm6
DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
DB 15,194,238,1 ; cmpltps %xmm6,%xmm5
- DB 15,84,174,135,46,0,0 ; andps 0x2e87(%esi),%xmm5
- DB 139,117,24 ; mov 0x18(%ebp),%esi
- DB 15,40,125,40 ; movaps 0x28(%ebp),%xmm7
+ DB 15,84,169,8,36,0,0 ; andps 0x2408(%ecx),%xmm5
DB 15,92,245 ; subps %xmm5,%xmm6
- DB 15,40,109,56 ; movaps 0x38(%ebp),%xmm5
DB 15,198,228,0 ; shufps $0x0,%xmm4,%xmm4
DB 15,89,244 ; mulps %xmm4,%xmm6
DB 15,92,198 ; subps %xmm6,%xmm0
- DB 102,15,118,246 ; pcmpeqd %xmm6,%xmm6
- DB 102,15,254,244 ; paddd %xmm4,%xmm6
- DB 15,40,101,72 ; movaps 0x48(%ebp),%xmm4
- DB 15,93,198 ; minps %xmm6,%xmm0
- DB 15,40,117,88 ; movaps 0x58(%ebp),%xmm6
- DB 141,90,8 ; lea 0x8(%edx),%ebx
- DB 15,41,116,36,80 ; movaps %xmm6,0x50(%esp)
- DB 15,41,100,36,64 ; movaps %xmm4,0x40(%esp)
- DB 15,41,108,36,48 ; movaps %xmm5,0x30(%esp)
- DB 15,41,124,36,32 ; movaps %xmm7,0x20(%esp)
- DB 137,116,36,16 ; mov %esi,0x10(%esp)
- DB 137,124,36,12 ; mov %edi,0xc(%esp)
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
- DB 255,82,4 ; call *0x4(%edx)
- DB 131,196,108 ; add $0x6c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 102,15,118,237 ; pcmpeqd %xmm5,%xmm5
+ DB 102,15,254,236 ; paddd %xmm4,%xmm5
+ DB 15,93,197 ; minps %xmm5,%xmm0
+ DB 141,72,8 ; lea 0x8(%eax),%ecx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 81 ; push %ecx
+ DB 255,117,8 ; pushl 0x8(%ebp)
+ DB 255,80,4 ; call *0x4(%eax)
+ DB 131,196,24 ; add $0x18,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -45050,52 +43357,32 @@ PUBLIC _sk_repeat_y_sse2
_sk_repeat_y_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 232,0,0,0,0 ; call 73a8 <_sk_repeat_y_sse2+0xe>
- DB 94 ; pop %esi
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
- DB 139,85,12 ; mov 0xc(%ebp),%edx
- DB 139,58 ; mov (%edx),%edi
- DB 243,15,16,39 ; movss (%edi),%xmm4
- DB 243,15,16,111,4 ; movss 0x4(%edi),%xmm5
- DB 139,125,20 ; mov 0x14(%ebp),%edi
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 232,0,0,0,0 ; call 5b05 <_sk_repeat_y_sse2+0xb>
+ DB 89 ; pop %ecx
+ DB 139,69,12 ; mov 0xc(%ebp),%eax
+ DB 139,16 ; mov (%eax),%edx
+ DB 243,15,16,34 ; movss (%edx),%xmm4
+ DB 243,15,16,106,4 ; movss 0x4(%edx),%xmm5
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
DB 15,89,233 ; mulps %xmm1,%xmm5
DB 243,15,91,245 ; cvttps2dq %xmm5,%xmm6
DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
DB 15,194,238,1 ; cmpltps %xmm6,%xmm5
- DB 15,84,174,248,45,0,0 ; andps 0x2df8(%esi),%xmm5
- DB 139,117,24 ; mov 0x18(%ebp),%esi
- DB 15,40,125,40 ; movaps 0x28(%ebp),%xmm7
+ DB 15,84,169,187,35,0,0 ; andps 0x23bb(%ecx),%xmm5
DB 15,92,245 ; subps %xmm5,%xmm6
- DB 15,40,109,56 ; movaps 0x38(%ebp),%xmm5
DB 15,198,228,0 ; shufps $0x0,%xmm4,%xmm4
DB 15,89,244 ; mulps %xmm4,%xmm6
DB 15,92,206 ; subps %xmm6,%xmm1
- DB 102,15,118,246 ; pcmpeqd %xmm6,%xmm6
- DB 102,15,254,244 ; paddd %xmm4,%xmm6
- DB 15,40,101,72 ; movaps 0x48(%ebp),%xmm4
- DB 15,93,206 ; minps %xmm6,%xmm1
- DB 15,40,117,88 ; movaps 0x58(%ebp),%xmm6
- DB 141,90,8 ; lea 0x8(%edx),%ebx
- DB 15,41,116,36,80 ; movaps %xmm6,0x50(%esp)
- DB 15,41,100,36,64 ; movaps %xmm4,0x40(%esp)
- DB 15,41,108,36,48 ; movaps %xmm5,0x30(%esp)
- DB 15,41,124,36,32 ; movaps %xmm7,0x20(%esp)
- DB 137,116,36,16 ; mov %esi,0x10(%esp)
- DB 137,124,36,12 ; mov %edi,0xc(%esp)
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
- DB 255,82,4 ; call *0x4(%edx)
- DB 131,196,108 ; add $0x6c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 102,15,118,237 ; pcmpeqd %xmm5,%xmm5
+ DB 102,15,254,236 ; paddd %xmm4,%xmm5
+ DB 15,93,205 ; minps %xmm5,%xmm1
+ DB 141,72,8 ; lea 0x8(%eax),%ecx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 81 ; push %ecx
+ DB 255,117,8 ; pushl 0x8(%ebp)
+ DB 255,80,4 ; call *0x4(%eax)
+ DB 131,196,24 ; add $0x18,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -45103,61 +43390,41 @@ PUBLIC _sk_mirror_x_sse2
_sk_mirror_x_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 232,0,0,0,0 ; call 7447 <_sk_mirror_x_sse2+0xe>
- DB 95 ; pop %edi
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
- DB 139,85,12 ; mov 0xc(%ebp),%edx
- DB 139,50 ; mov (%edx),%esi
- DB 243,15,16,46 ; movss (%esi),%xmm5
- DB 243,15,16,118,4 ; movss 0x4(%esi),%xmm6
- DB 139,117,20 ; mov 0x14(%ebp),%esi
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 232,0,0,0,0 ; call 5b62 <_sk_mirror_x_sse2+0xb>
+ DB 89 ; pop %ecx
+ DB 139,69,12 ; mov 0xc(%ebp),%eax
+ DB 139,16 ; mov (%eax),%edx
+ DB 243,15,16,42 ; movss (%edx),%xmm5
+ DB 243,15,16,114,4 ; movss 0x4(%edx),%xmm6
DB 15,40,229 ; movaps %xmm5,%xmm4
DB 15,198,228,0 ; shufps $0x0,%xmm4,%xmm4
DB 15,92,196 ; subps %xmm4,%xmm0
- DB 243,15,89,183,89,50,0,0 ; mulss 0x3259(%edi),%xmm6
+ DB 243,15,89,177,94,40,0,0 ; mulss 0x285e(%ecx),%xmm6
DB 15,198,246,0 ; shufps $0x0,%xmm6,%xmm6
DB 15,89,240 ; mulps %xmm0,%xmm6
DB 243,15,91,254 ; cvttps2dq %xmm6,%xmm7
DB 15,91,255 ; cvtdq2ps %xmm7,%xmm7
DB 15,194,247,1 ; cmpltps %xmm7,%xmm6
- DB 15,84,183,105,45,0,0 ; andps 0x2d69(%edi),%xmm6
- DB 139,125,24 ; mov 0x18(%ebp),%edi
+ DB 15,84,177,110,35,0,0 ; andps 0x236e(%ecx),%xmm6
DB 15,92,254 ; subps %xmm6,%xmm7
- DB 15,40,117,40 ; movaps 0x28(%ebp),%xmm6
DB 243,15,88,237 ; addss %xmm5,%xmm5
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
DB 15,89,253 ; mulps %xmm5,%xmm7
- DB 15,40,109,56 ; movaps 0x38(%ebp),%xmm5
DB 15,92,199 ; subps %xmm7,%xmm0
- DB 15,87,255 ; xorps %xmm7,%xmm7
+ DB 15,87,237 ; xorps %xmm5,%xmm5
DB 15,92,196 ; subps %xmm4,%xmm0
- DB 15,92,248 ; subps %xmm0,%xmm7
- DB 15,84,199 ; andps %xmm7,%xmm0
- DB 102,15,118,255 ; pcmpeqd %xmm7,%xmm7
- DB 102,15,254,252 ; paddd %xmm4,%xmm7
- DB 15,40,101,72 ; movaps 0x48(%ebp),%xmm4
- DB 15,93,199 ; minps %xmm7,%xmm0
- DB 15,40,125,88 ; movaps 0x58(%ebp),%xmm7
- DB 141,90,8 ; lea 0x8(%edx),%ebx
- DB 15,41,124,36,80 ; movaps %xmm7,0x50(%esp)
- DB 15,41,100,36,64 ; movaps %xmm4,0x40(%esp)
- DB 15,41,108,36,48 ; movaps %xmm5,0x30(%esp)
- DB 15,41,116,36,32 ; movaps %xmm6,0x20(%esp)
- DB 137,124,36,16 ; mov %edi,0x10(%esp)
- DB 137,116,36,12 ; mov %esi,0xc(%esp)
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
- DB 255,82,4 ; call *0x4(%edx)
- DB 131,196,108 ; add $0x6c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 15,92,232 ; subps %xmm0,%xmm5
+ DB 15,84,197 ; andps %xmm5,%xmm0
+ DB 102,15,118,237 ; pcmpeqd %xmm5,%xmm5
+ DB 102,15,254,236 ; paddd %xmm4,%xmm5
+ DB 15,93,197 ; minps %xmm5,%xmm0
+ DB 141,72,8 ; lea 0x8(%eax),%ecx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 81 ; push %ecx
+ DB 255,117,8 ; pushl 0x8(%ebp)
+ DB 255,80,4 ; call *0x4(%eax)
+ DB 131,196,24 ; add $0x18,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -45165,61 +43432,41 @@ PUBLIC _sk_mirror_y_sse2
_sk_mirror_y_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 232,0,0,0,0 ; call 7508 <_sk_mirror_y_sse2+0xe>
- DB 95 ; pop %edi
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
- DB 139,85,12 ; mov 0xc(%ebp),%edx
- DB 139,50 ; mov (%edx),%esi
- DB 243,15,16,46 ; movss (%esi),%xmm5
- DB 243,15,16,118,4 ; movss 0x4(%esi),%xmm6
- DB 139,117,20 ; mov 0x14(%ebp),%esi
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 232,0,0,0,0 ; call 5be1 <_sk_mirror_y_sse2+0xb>
+ DB 89 ; pop %ecx
+ DB 139,69,12 ; mov 0xc(%ebp),%eax
+ DB 139,16 ; mov (%eax),%edx
+ DB 243,15,16,42 ; movss (%edx),%xmm5
+ DB 243,15,16,114,4 ; movss 0x4(%edx),%xmm6
DB 15,40,229 ; movaps %xmm5,%xmm4
DB 15,198,228,0 ; shufps $0x0,%xmm4,%xmm4
DB 15,92,204 ; subps %xmm4,%xmm1
- DB 243,15,89,183,156,49,0,0 ; mulss 0x319c(%edi),%xmm6
+ DB 243,15,89,177,227,39,0,0 ; mulss 0x27e3(%ecx),%xmm6
DB 15,198,246,0 ; shufps $0x0,%xmm6,%xmm6
DB 15,89,241 ; mulps %xmm1,%xmm6
DB 243,15,91,254 ; cvttps2dq %xmm6,%xmm7
DB 15,91,255 ; cvtdq2ps %xmm7,%xmm7
DB 15,194,247,1 ; cmpltps %xmm7,%xmm6
- DB 15,84,183,184,44,0,0 ; andps 0x2cb8(%edi),%xmm6
- DB 139,125,24 ; mov 0x18(%ebp),%edi
+ DB 15,84,177,255,34,0,0 ; andps 0x22ff(%ecx),%xmm6
DB 15,92,254 ; subps %xmm6,%xmm7
- DB 15,40,117,40 ; movaps 0x28(%ebp),%xmm6
DB 243,15,88,237 ; addss %xmm5,%xmm5
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
DB 15,89,253 ; mulps %xmm5,%xmm7
- DB 15,40,109,56 ; movaps 0x38(%ebp),%xmm5
DB 15,92,207 ; subps %xmm7,%xmm1
- DB 15,87,255 ; xorps %xmm7,%xmm7
+ DB 15,87,237 ; xorps %xmm5,%xmm5
DB 15,92,204 ; subps %xmm4,%xmm1
- DB 15,92,249 ; subps %xmm1,%xmm7
- DB 15,84,207 ; andps %xmm7,%xmm1
- DB 102,15,118,255 ; pcmpeqd %xmm7,%xmm7
- DB 102,15,254,252 ; paddd %xmm4,%xmm7
- DB 15,40,101,72 ; movaps 0x48(%ebp),%xmm4
- DB 15,93,207 ; minps %xmm7,%xmm1
- DB 15,40,125,88 ; movaps 0x58(%ebp),%xmm7
- DB 141,90,8 ; lea 0x8(%edx),%ebx
- DB 15,41,124,36,80 ; movaps %xmm7,0x50(%esp)
- DB 15,41,100,36,64 ; movaps %xmm4,0x40(%esp)
- DB 15,41,108,36,48 ; movaps %xmm5,0x30(%esp)
- DB 15,41,116,36,32 ; movaps %xmm6,0x20(%esp)
- DB 137,124,36,16 ; mov %edi,0x10(%esp)
- DB 137,116,36,12 ; mov %esi,0xc(%esp)
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
- DB 255,82,4 ; call *0x4(%edx)
- DB 131,196,108 ; add $0x6c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 15,92,233 ; subps %xmm1,%xmm5
+ DB 15,84,205 ; andps %xmm5,%xmm1
+ DB 102,15,118,237 ; pcmpeqd %xmm5,%xmm5
+ DB 102,15,254,236 ; paddd %xmm4,%xmm5
+ DB 15,93,205 ; minps %xmm5,%xmm1
+ DB 141,72,8 ; lea 0x8(%eax),%ecx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 81 ; push %ecx
+ DB 255,117,8 ; pushl 0x8(%ebp)
+ DB 255,80,4 ; call *0x4(%eax)
+ DB 131,196,24 ; add $0x18,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -45227,40 +43474,20 @@ PUBLIC _sk_clamp_x_1_sse2
_sk_clamp_x_1_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 232,0,0,0,0 ; call 75c9 <_sk_clamp_x_1_sse2+0xe>
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 232,0,0,0,0 ; call 5c60 <_sk_clamp_x_1_sse2+0xb>
DB 88 ; pop %eax
- DB 139,77,8 ; mov 0x8(%ebp),%ecx
- DB 139,85,16 ; mov 0x10(%ebp),%edx
- DB 139,117,20 ; mov 0x14(%ebp),%esi
- DB 139,125,24 ; mov 0x18(%ebp),%edi
- DB 15,40,109,40 ; movaps 0x28(%ebp),%xmm5
- DB 15,40,117,56 ; movaps 0x38(%ebp),%xmm6
- DB 15,40,125,72 ; movaps 0x48(%ebp),%xmm7
+ DB 139,77,12 ; mov 0xc(%ebp),%ecx
DB 15,87,228 ; xorps %xmm4,%xmm4
DB 15,95,224 ; maxps %xmm0,%xmm4
- DB 15,40,69,88 ; movaps 0x58(%ebp),%xmm0
- DB 15,93,160,7,44,0,0 ; minps 0x2c07(%eax),%xmm4
- DB 139,69,12 ; mov 0xc(%ebp),%eax
- DB 141,88,4 ; lea 0x4(%eax),%ebx
- DB 15,41,68,36,80 ; movaps %xmm0,0x50(%esp)
- DB 15,41,124,36,64 ; movaps %xmm7,0x40(%esp)
- DB 15,41,116,36,48 ; movaps %xmm6,0x30(%esp)
- DB 15,41,108,36,32 ; movaps %xmm5,0x20(%esp)
- DB 137,124,36,16 ; mov %edi,0x10(%esp)
- DB 137,116,36,12 ; mov %esi,0xc(%esp)
- DB 137,84,36,8 ; mov %edx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,12,36 ; mov %ecx,(%esp)
+ DB 15,93,160,144,34,0,0 ; minps 0x2290(%eax),%xmm4
+ DB 141,65,4 ; lea 0x4(%ecx),%eax
+ DB 131,236,8 ; sub $0x8,%esp
DB 15,40,196 ; movaps %xmm4,%xmm0
- DB 255,16 ; call *(%eax)
- DB 131,196,108 ; add $0x6c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 80 ; push %eax
+ DB 255,117,8 ; pushl 0x8(%ebp)
+ DB 255,17 ; call *(%ecx)
+ DB 131,196,24 ; add $0x18,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -45268,43 +43495,23 @@ PUBLIC _sk_repeat_x_1_sse2
_sk_repeat_x_1_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 232,0,0,0,0 ; call 763b <_sk_repeat_x_1_sse2+0xe>
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 232,0,0,0,0 ; call 5c90 <_sk_repeat_x_1_sse2+0xb>
DB 88 ; pop %eax
- DB 139,77,8 ; mov 0x8(%ebp),%ecx
- DB 139,85,16 ; mov 0x10(%ebp),%edx
- DB 139,117,20 ; mov 0x14(%ebp),%esi
- DB 139,125,24 ; mov 0x18(%ebp),%edi
- DB 15,40,101,40 ; movaps 0x28(%ebp),%xmm4
- DB 15,40,109,56 ; movaps 0x38(%ebp),%xmm5
- DB 243,15,91,240 ; cvttps2dq %xmm0,%xmm6
- DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
- DB 15,40,248 ; movaps %xmm0,%xmm7
- DB 15,194,254,1 ; cmpltps %xmm6,%xmm7
- DB 15,84,184,165,43,0,0 ; andps 0x2ba5(%eax),%xmm7
- DB 15,92,247 ; subps %xmm7,%xmm6
- DB 15,40,125,72 ; movaps 0x48(%ebp),%xmm7
- DB 15,92,198 ; subps %xmm6,%xmm0
- DB 15,40,117,88 ; movaps 0x58(%ebp),%xmm6
- DB 139,69,12 ; mov 0xc(%ebp),%eax
- DB 141,88,4 ; lea 0x4(%eax),%ebx
- DB 15,41,116,36,80 ; movaps %xmm6,0x50(%esp)
- DB 15,41,124,36,64 ; movaps %xmm7,0x40(%esp)
- DB 15,41,108,36,48 ; movaps %xmm5,0x30(%esp)
- DB 15,41,100,36,32 ; movaps %xmm4,0x20(%esp)
- DB 137,124,36,16 ; mov %edi,0x10(%esp)
- DB 137,116,36,12 ; mov %esi,0xc(%esp)
- DB 137,84,36,8 ; mov %edx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,12,36 ; mov %ecx,(%esp)
- DB 255,16 ; call *(%eax)
- DB 131,196,108 ; add $0x6c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 139,77,12 ; mov 0xc(%ebp),%ecx
+ DB 243,15,91,224 ; cvttps2dq %xmm0,%xmm4
+ DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
+ DB 15,40,232 ; movaps %xmm0,%xmm5
+ DB 15,194,236,1 ; cmpltps %xmm4,%xmm5
+ DB 15,84,168,112,34,0,0 ; andps 0x2270(%eax),%xmm5
+ DB 15,92,229 ; subps %xmm5,%xmm4
+ DB 15,92,196 ; subps %xmm4,%xmm0
+ DB 141,65,4 ; lea 0x4(%ecx),%eax
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 80 ; push %eax
+ DB 255,117,8 ; pushl 0x8(%ebp)
+ DB 255,17 ; call *(%ecx)
+ DB 131,196,24 ; add $0x18,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -45312,51 +43519,31 @@ PUBLIC _sk_mirror_x_1_sse2
_sk_mirror_x_1_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 232,0,0,0,0 ; call 76b8 <_sk_mirror_x_1_sse2+0xe>
- DB 95 ; pop %edi
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
- DB 139,85,20 ; mov 0x14(%ebp),%edx
- DB 139,117,24 ; mov 0x18(%ebp),%esi
- DB 15,40,101,40 ; movaps 0x28(%ebp),%xmm4
- DB 15,40,175,56,43,0,0 ; movaps 0x2b38(%edi),%xmm5
- DB 15,88,197 ; addps %xmm5,%xmm0
- DB 15,40,183,72,43,0,0 ; movaps 0x2b48(%edi),%xmm6
- DB 15,89,240 ; mulps %xmm0,%xmm6
- DB 243,15,91,254 ; cvttps2dq %xmm6,%xmm7
- DB 15,91,255 ; cvtdq2ps %xmm7,%xmm7
- DB 15,194,247,1 ; cmpltps %xmm7,%xmm6
- DB 15,84,183,88,43,0,0 ; andps 0x2b58(%edi),%xmm6
- DB 15,92,254 ; subps %xmm6,%xmm7
- DB 15,40,117,56 ; movaps 0x38(%ebp),%xmm6
- DB 15,88,255 ; addps %xmm7,%xmm7
- DB 15,92,199 ; subps %xmm7,%xmm0
- DB 15,40,125,72 ; movaps 0x48(%ebp),%xmm7
- DB 15,88,197 ; addps %xmm5,%xmm0
- DB 15,87,237 ; xorps %xmm5,%xmm5
- DB 15,92,232 ; subps %xmm0,%xmm5
- DB 15,84,197 ; andps %xmm5,%xmm0
- DB 15,40,109,88 ; movaps 0x58(%ebp),%xmm5
- DB 139,125,12 ; mov 0xc(%ebp),%edi
- DB 141,95,4 ; lea 0x4(%edi),%ebx
- DB 15,41,108,36,80 ; movaps %xmm5,0x50(%esp)
- DB 15,41,124,36,64 ; movaps %xmm7,0x40(%esp)
- DB 15,41,116,36,48 ; movaps %xmm6,0x30(%esp)
- DB 15,41,100,36,32 ; movaps %xmm4,0x20(%esp)
- DB 137,116,36,16 ; mov %esi,0x10(%esp)
- DB 137,84,36,12 ; mov %edx,0xc(%esp)
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
- DB 255,23 ; call *(%edi)
- DB 131,196,108 ; add $0x6c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 232,0,0,0,0 ; call 5ccb <_sk_mirror_x_1_sse2+0xb>
+ DB 89 ; pop %ecx
+ DB 139,69,12 ; mov 0xc(%ebp),%eax
+ DB 15,40,161,69,34,0,0 ; movaps 0x2245(%ecx),%xmm4
+ DB 15,88,196 ; addps %xmm4,%xmm0
+ DB 15,40,169,85,34,0,0 ; movaps 0x2255(%ecx),%xmm5
+ DB 15,89,232 ; mulps %xmm0,%xmm5
+ DB 243,15,91,245 ; cvttps2dq %xmm5,%xmm6
+ DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
+ DB 15,194,238,1 ; cmpltps %xmm6,%xmm5
+ DB 15,84,169,101,34,0,0 ; andps 0x2265(%ecx),%xmm5
+ DB 15,87,255 ; xorps %xmm7,%xmm7
+ DB 15,92,245 ; subps %xmm5,%xmm6
+ DB 15,88,246 ; addps %xmm6,%xmm6
+ DB 15,92,198 ; subps %xmm6,%xmm0
+ DB 15,88,196 ; addps %xmm4,%xmm0
+ DB 15,92,248 ; subps %xmm0,%xmm7
+ DB 15,84,199 ; andps %xmm7,%xmm0
+ DB 141,72,4 ; lea 0x4(%eax),%ecx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 81 ; push %ecx
+ DB 255,117,8 ; pushl 0x8(%ebp)
+ DB 255,16 ; call *(%eax)
+ DB 131,196,24 ; add $0x18,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -45364,45 +43551,25 @@ PUBLIC _sk_luminance_to_alpha_sse2
_sk_luminance_to_alpha_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
+ DB 131,236,8 ; sub $0x8,%esp
DB 15,40,218 ; movaps %xmm2,%xmm3
- DB 232,0,0,0,0 ; call 7758 <_sk_luminance_to_alpha_sse2+0x11>
+ DB 232,0,0,0,0 ; call 5d29 <_sk_luminance_to_alpha_sse2+0xe>
DB 88 ; pop %eax
- DB 139,77,8 ; mov 0x8(%ebp),%ecx
- DB 139,85,16 ; mov 0x10(%ebp),%edx
- DB 139,117,20 ; mov 0x14(%ebp),%esi
- DB 139,125,24 ; mov 0x18(%ebp),%edi
- DB 15,40,85,40 ; movaps 0x28(%ebp),%xmm2
- DB 15,40,101,56 ; movaps 0x38(%ebp),%xmm4
- DB 15,40,109,72 ; movaps 0x48(%ebp),%xmm5
- DB 15,40,117,88 ; movaps 0x58(%ebp),%xmm6
- DB 15,89,128,200,42,0,0 ; mulps 0x2ac8(%eax),%xmm0
- DB 15,89,136,216,42,0,0 ; mulps 0x2ad8(%eax),%xmm1
- DB 15,89,152,232,42,0,0 ; mulps 0x2ae8(%eax),%xmm3
- DB 139,69,12 ; mov 0xc(%ebp),%eax
+ DB 139,77,12 ; mov 0xc(%ebp),%ecx
+ DB 15,89,128,23,34,0,0 ; mulps 0x2217(%eax),%xmm0
+ DB 15,89,136,39,34,0,0 ; mulps 0x2227(%eax),%xmm1
DB 15,88,200 ; addps %xmm0,%xmm1
+ DB 15,89,152,55,34,0,0 ; mulps 0x2237(%eax),%xmm3
DB 15,88,217 ; addps %xmm1,%xmm3
- DB 141,88,4 ; lea 0x4(%eax),%ebx
- DB 15,41,116,36,80 ; movaps %xmm6,0x50(%esp)
- DB 15,41,108,36,64 ; movaps %xmm5,0x40(%esp)
- DB 15,41,100,36,48 ; movaps %xmm4,0x30(%esp)
- DB 15,41,84,36,32 ; movaps %xmm2,0x20(%esp)
- DB 137,124,36,16 ; mov %edi,0x10(%esp)
- DB 137,116,36,12 ; mov %esi,0xc(%esp)
- DB 137,84,36,8 ; mov %edx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,12,36 ; mov %ecx,(%esp)
+ DB 141,65,4 ; lea 0x4(%ecx),%eax
+ DB 131,236,8 ; sub $0x8,%esp
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 15,87,201 ; xorps %xmm1,%xmm1
DB 15,87,210 ; xorps %xmm2,%xmm2
- DB 255,16 ; call *(%eax)
- DB 131,196,108 ; add $0x6c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 80 ; push %eax
+ DB 255,117,8 ; pushl 0x8(%ebp)
+ DB 255,17 ; call *(%ecx)
+ DB 131,196,24 ; add $0x18,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -45410,41 +43577,21 @@ PUBLIC _sk_matrix_translate_sse2
_sk_matrix_translate_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
- DB 139,85,20 ; mov 0x14(%ebp),%edx
- DB 139,117,12 ; mov 0xc(%ebp),%esi
- DB 139,62 ; mov (%esi),%edi
- DB 243,15,16,39 ; movss (%edi),%xmm4
- DB 243,15,16,111,4 ; movss 0x4(%edi),%xmm5
- DB 139,125,24 ; mov 0x18(%ebp),%edi
- DB 15,40,117,40 ; movaps 0x28(%ebp),%xmm6
- DB 15,40,125,56 ; movaps 0x38(%ebp),%xmm7
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 139,69,12 ; mov 0xc(%ebp),%eax
+ DB 139,8 ; mov (%eax),%ecx
+ DB 243,15,16,33 ; movss (%ecx),%xmm4
+ DB 243,15,16,105,4 ; movss 0x4(%ecx),%xmm5
DB 15,198,228,0 ; shufps $0x0,%xmm4,%xmm4
DB 15,88,196 ; addps %xmm4,%xmm0
- DB 15,40,101,72 ; movaps 0x48(%ebp),%xmm4
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
DB 15,88,205 ; addps %xmm5,%xmm1
- DB 15,40,109,88 ; movaps 0x58(%ebp),%xmm5
- DB 141,94,8 ; lea 0x8(%esi),%ebx
- DB 15,41,108,36,80 ; movaps %xmm5,0x50(%esp)
- DB 15,41,100,36,64 ; movaps %xmm4,0x40(%esp)
- DB 15,41,124,36,48 ; movaps %xmm7,0x30(%esp)
- DB 15,41,116,36,32 ; movaps %xmm6,0x20(%esp)
- DB 137,124,36,16 ; mov %edi,0x10(%esp)
- DB 137,84,36,12 ; mov %edx,0xc(%esp)
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
- DB 255,86,4 ; call *0x4(%esi)
- DB 131,196,108 ; add $0x6c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 141,72,8 ; lea 0x8(%eax),%ecx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 81 ; push %ecx
+ DB 255,117,8 ; pushl 0x8(%ebp)
+ DB 255,80,4 ; call *0x4(%eax)
+ DB 131,196,24 ; add $0x18,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -45452,47 +43599,27 @@ PUBLIC _sk_matrix_scale_translate_sse2
_sk_matrix_scale_translate_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
- DB 139,117,20 ; mov 0x14(%ebp),%esi
- DB 139,85,12 ; mov 0xc(%ebp),%edx
- DB 139,58 ; mov (%edx),%edi
- DB 243,15,16,103,8 ; movss 0x8(%edi),%xmm4
- DB 243,15,16,47 ; movss (%edi),%xmm5
- DB 243,15,16,119,4 ; movss 0x4(%edi),%xmm6
- DB 243,15,16,127,12 ; movss 0xc(%edi),%xmm7
- DB 139,125,24 ; mov 0x18(%ebp),%edi
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 139,69,12 ; mov 0xc(%ebp),%eax
+ DB 139,8 ; mov (%eax),%ecx
+ DB 243,15,16,97,8 ; movss 0x8(%ecx),%xmm4
DB 15,198,228,0 ; shufps $0x0,%xmm4,%xmm4
- DB 15,89,196 ; mulps %xmm4,%xmm0
- DB 15,40,101,40 ; movaps 0x28(%ebp),%xmm4
+ DB 243,15,16,41 ; movss (%ecx),%xmm5
+ DB 243,15,16,113,4 ; movss 0x4(%ecx),%xmm6
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
+ DB 15,89,196 ; mulps %xmm4,%xmm0
DB 15,88,197 ; addps %xmm5,%xmm0
- DB 15,40,109,56 ; movaps 0x38(%ebp),%xmm5
- DB 15,198,255,0 ; shufps $0x0,%xmm7,%xmm7
- DB 15,89,207 ; mulps %xmm7,%xmm1
- DB 15,40,125,72 ; movaps 0x48(%ebp),%xmm7
+ DB 243,15,16,97,12 ; movss 0xc(%ecx),%xmm4
+ DB 15,198,228,0 ; shufps $0x0,%xmm4,%xmm4
DB 15,198,246,0 ; shufps $0x0,%xmm6,%xmm6
+ DB 15,89,204 ; mulps %xmm4,%xmm1
DB 15,88,206 ; addps %xmm6,%xmm1
- DB 15,40,117,88 ; movaps 0x58(%ebp),%xmm6
- DB 141,90,8 ; lea 0x8(%edx),%ebx
- DB 15,41,116,36,80 ; movaps %xmm6,0x50(%esp)
- DB 15,41,124,36,64 ; movaps %xmm7,0x40(%esp)
- DB 15,41,108,36,48 ; movaps %xmm5,0x30(%esp)
- DB 15,41,100,36,32 ; movaps %xmm4,0x20(%esp)
- DB 137,124,36,16 ; mov %edi,0x10(%esp)
- DB 137,116,36,12 ; mov %esi,0xc(%esp)
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
- DB 255,82,4 ; call *0x4(%edx)
- DB 131,196,108 ; add $0x6c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 141,72,8 ; lea 0x8(%eax),%ecx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 81 ; push %ecx
+ DB 255,117,8 ; pushl 0x8(%ebp)
+ DB 255,80,4 ; call *0x4(%eax)
+ DB 131,196,24 ; add $0x18,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -45500,57 +43627,37 @@ PUBLIC _sk_matrix_2x3_sse2
_sk_matrix_2x3_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
+ DB 131,236,8 ; sub $0x8,%esp
DB 15,40,233 ; movaps %xmm1,%xmm5
DB 15,40,224 ; movaps %xmm0,%xmm4
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
- DB 139,117,20 ; mov 0x14(%ebp),%esi
- DB 139,85,12 ; mov 0xc(%ebp),%edx
- DB 139,58 ; mov (%edx),%edi
- DB 243,15,16,7 ; movss (%edi),%xmm0
- DB 243,15,16,79,4 ; movss 0x4(%edi),%xmm1
+ DB 139,69,12 ; mov 0xc(%ebp),%eax
+ DB 139,8 ; mov (%eax),%ecx
+ DB 243,15,16,1 ; movss (%ecx),%xmm0
+ DB 243,15,16,73,4 ; movss 0x4(%ecx),%xmm1
DB 15,198,192,0 ; shufps $0x0,%xmm0,%xmm0
- DB 243,15,16,119,8 ; movss 0x8(%edi),%xmm6
+ DB 243,15,16,113,8 ; movss 0x8(%ecx),%xmm6
DB 15,198,246,0 ; shufps $0x0,%xmm6,%xmm6
- DB 243,15,16,127,16 ; movss 0x10(%edi),%xmm7
+ DB 243,15,16,121,16 ; movss 0x10(%ecx),%xmm7
DB 15,198,255,0 ; shufps $0x0,%xmm7,%xmm7
DB 15,89,245 ; mulps %xmm5,%xmm6
DB 15,88,247 ; addps %xmm7,%xmm6
DB 15,89,196 ; mulps %xmm4,%xmm0
DB 15,88,198 ; addps %xmm6,%xmm0
- DB 243,15,16,119,12 ; movss 0xc(%edi),%xmm6
- DB 243,15,16,127,20 ; movss 0x14(%edi),%xmm7
- DB 139,125,24 ; mov 0x18(%ebp),%edi
+ DB 15,198,201,0 ; shufps $0x0,%xmm1,%xmm1
+ DB 243,15,16,113,12 ; movss 0xc(%ecx),%xmm6
DB 15,198,246,0 ; shufps $0x0,%xmm6,%xmm6
- DB 15,89,245 ; mulps %xmm5,%xmm6
- DB 15,40,109,40 ; movaps 0x28(%ebp),%xmm5
+ DB 243,15,16,121,20 ; movss 0x14(%ecx),%xmm7
DB 15,198,255,0 ; shufps $0x0,%xmm7,%xmm7
+ DB 15,89,245 ; mulps %xmm5,%xmm6
DB 15,88,247 ; addps %xmm7,%xmm6
- DB 15,40,125,56 ; movaps 0x38(%ebp),%xmm7
- DB 15,198,201,0 ; shufps $0x0,%xmm1,%xmm1
DB 15,89,204 ; mulps %xmm4,%xmm1
- DB 15,40,101,72 ; movaps 0x48(%ebp),%xmm4
DB 15,88,206 ; addps %xmm6,%xmm1
- DB 15,40,117,88 ; movaps 0x58(%ebp),%xmm6
- DB 141,90,8 ; lea 0x8(%edx),%ebx
- DB 15,41,116,36,80 ; movaps %xmm6,0x50(%esp)
- DB 15,41,100,36,64 ; movaps %xmm4,0x40(%esp)
- DB 15,41,124,36,48 ; movaps %xmm7,0x30(%esp)
- DB 15,41,108,36,32 ; movaps %xmm5,0x20(%esp)
- DB 137,124,36,16 ; mov %edi,0x10(%esp)
- DB 137,116,36,12 ; mov %esi,0xc(%esp)
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
- DB 255,82,4 ; call *0x4(%edx)
- DB 131,196,108 ; add $0x6c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 141,72,8 ; lea 0x8(%eax),%ecx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 81 ; push %ecx
+ DB 255,117,8 ; pushl 0x8(%ebp)
+ DB 255,80,4 ; call *0x4(%eax)
+ DB 131,196,24 ; add $0x18,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -45558,80 +43665,59 @@ PUBLIC _sk_matrix_3x4_sse2
_sk_matrix_3x4_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 15,40,225 ; movaps %xmm1,%xmm4
- DB 15,40,232 ; movaps %xmm0,%xmm5
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
- DB 139,117,20 ; mov 0x14(%ebp),%esi
- DB 139,85,12 ; mov 0xc(%ebp),%edx
- DB 139,58 ; mov (%edx),%edi
- DB 243,15,16,7 ; movss (%edi),%xmm0
- DB 243,15,16,79,4 ; movss 0x4(%edi),%xmm1
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 15,40,224 ; movaps %xmm0,%xmm4
+ DB 139,69,12 ; mov 0xc(%ebp),%eax
+ DB 139,8 ; mov (%eax),%ecx
+ DB 243,15,16,1 ; movss (%ecx),%xmm0
DB 15,198,192,0 ; shufps $0x0,%xmm0,%xmm0
- DB 243,15,16,119,24 ; movss 0x18(%edi),%xmm6
+ DB 243,15,16,105,24 ; movss 0x18(%ecx),%xmm5
+ DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
+ DB 243,15,16,113,36 ; movss 0x24(%ecx),%xmm6
DB 15,198,246,0 ; shufps $0x0,%xmm6,%xmm6
- DB 243,15,16,127,36 ; movss 0x24(%edi),%xmm7
- DB 15,198,255,0 ; shufps $0x0,%xmm7,%xmm7
- DB 15,89,242 ; mulps %xmm2,%xmm6
- DB 15,88,247 ; addps %xmm7,%xmm6
- DB 243,15,16,127,12 ; movss 0xc(%edi),%xmm7
- DB 15,198,255,0 ; shufps $0x0,%xmm7,%xmm7
- DB 15,89,252 ; mulps %xmm4,%xmm7
- DB 15,88,254 ; addps %xmm6,%xmm7
- DB 15,89,197 ; mulps %xmm5,%xmm0
- DB 15,88,199 ; addps %xmm7,%xmm0
- DB 15,198,201,0 ; shufps $0x0,%xmm1,%xmm1
- DB 243,15,16,119,28 ; movss 0x1c(%edi),%xmm6
+ DB 15,89,234 ; mulps %xmm2,%xmm5
+ DB 15,88,238 ; addps %xmm6,%xmm5
+ DB 243,15,16,113,12 ; movss 0xc(%ecx),%xmm6
+ DB 15,198,246,0 ; shufps $0x0,%xmm6,%xmm6
+ DB 15,89,241 ; mulps %xmm1,%xmm6
+ DB 15,88,245 ; addps %xmm5,%xmm6
+ DB 15,89,196 ; mulps %xmm4,%xmm0
+ DB 15,88,198 ; addps %xmm6,%xmm0
+ DB 243,15,16,105,28 ; movss 0x1c(%ecx),%xmm5
+ DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
+ DB 243,15,16,113,40 ; movss 0x28(%ecx),%xmm6
+ DB 15,198,246,0 ; shufps $0x0,%xmm6,%xmm6
+ DB 15,89,234 ; mulps %xmm2,%xmm5
+ DB 15,88,238 ; addps %xmm6,%xmm5
+ DB 243,15,16,113,16 ; movss 0x10(%ecx),%xmm6
+ DB 15,198,246,0 ; shufps $0x0,%xmm6,%xmm6
+ DB 15,89,241 ; mulps %xmm1,%xmm6
+ DB 15,88,245 ; addps %xmm5,%xmm6
+ DB 243,15,16,105,4 ; movss 0x4(%ecx),%xmm5
+ DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
+ DB 15,89,236 ; mulps %xmm4,%xmm5
+ DB 15,88,238 ; addps %xmm6,%xmm5
+ DB 243,15,16,113,32 ; movss 0x20(%ecx),%xmm6
DB 15,198,246,0 ; shufps $0x0,%xmm6,%xmm6
- DB 243,15,16,127,40 ; movss 0x28(%edi),%xmm7
- DB 15,198,255,0 ; shufps $0x0,%xmm7,%xmm7
DB 15,89,242 ; mulps %xmm2,%xmm6
- DB 15,88,247 ; addps %xmm7,%xmm6
- DB 243,15,16,127,16 ; movss 0x10(%edi),%xmm7
+ DB 243,15,16,81,44 ; movss 0x2c(%ecx),%xmm2
+ DB 15,198,210,0 ; shufps $0x0,%xmm2,%xmm2
+ DB 15,88,242 ; addps %xmm2,%xmm6
+ DB 243,15,16,121,20 ; movss 0x14(%ecx),%xmm7
DB 15,198,255,0 ; shufps $0x0,%xmm7,%xmm7
- DB 15,89,252 ; mulps %xmm4,%xmm7
+ DB 15,89,249 ; mulps %xmm1,%xmm7
DB 15,88,254 ; addps %xmm6,%xmm7
- DB 15,89,205 ; mulps %xmm5,%xmm1
- DB 15,88,207 ; addps %xmm7,%xmm1
- DB 243,15,16,119,8 ; movss 0x8(%edi),%xmm6
- DB 243,15,16,127,32 ; movss 0x20(%edi),%xmm7
- DB 15,198,255,0 ; shufps $0x0,%xmm7,%xmm7
- DB 15,89,250 ; mulps %xmm2,%xmm7
- DB 243,15,16,87,44 ; movss 0x2c(%edi),%xmm2
- DB 15,198,210,0 ; shufps $0x0,%xmm2,%xmm2
- DB 15,88,250 ; addps %xmm2,%xmm7
- DB 243,15,16,87,20 ; movss 0x14(%edi),%xmm2
- DB 139,125,24 ; mov 0x18(%ebp),%edi
+ DB 243,15,16,81,8 ; movss 0x8(%ecx),%xmm2
DB 15,198,210,0 ; shufps $0x0,%xmm2,%xmm2
DB 15,89,212 ; mulps %xmm4,%xmm2
- DB 15,40,101,40 ; movaps 0x28(%ebp),%xmm4
DB 15,88,215 ; addps %xmm7,%xmm2
- DB 15,40,125,56 ; movaps 0x38(%ebp),%xmm7
- DB 15,198,246,0 ; shufps $0x0,%xmm6,%xmm6
- DB 15,89,245 ; mulps %xmm5,%xmm6
- DB 15,40,109,72 ; movaps 0x48(%ebp),%xmm5
- DB 15,88,242 ; addps %xmm2,%xmm6
- DB 15,40,85,88 ; movaps 0x58(%ebp),%xmm2
- DB 141,90,8 ; lea 0x8(%edx),%ebx
- DB 15,41,84,36,80 ; movaps %xmm2,0x50(%esp)
- DB 15,41,108,36,64 ; movaps %xmm5,0x40(%esp)
- DB 15,41,124,36,48 ; movaps %xmm7,0x30(%esp)
- DB 15,41,100,36,32 ; movaps %xmm4,0x20(%esp)
- DB 137,124,36,16 ; mov %edi,0x10(%esp)
- DB 137,116,36,12 ; mov %esi,0xc(%esp)
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
- DB 15,40,214 ; movaps %xmm6,%xmm2
- DB 255,82,4 ; call *0x4(%edx)
- DB 131,196,108 ; add $0x6c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 141,72,8 ; lea 0x8(%eax),%ecx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 15,40,205 ; movaps %xmm5,%xmm1
+ DB 81 ; push %ecx
+ DB 255,117,8 ; pushl 0x8(%ebp)
+ DB 255,80,4 ; call *0x4(%eax)
+ DB 131,196,24 ; add $0x18,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -45639,115 +43725,93 @@ PUBLIC _sk_matrix_4x5_sse2
_sk_matrix_4x5_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 131,236,124 ; sub $0x7c,%esp
- DB 15,40,226 ; movaps %xmm2,%xmm4
+ DB 131,236,8 ; sub $0x8,%esp
DB 15,40,233 ; movaps %xmm1,%xmm5
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
- DB 139,117,20 ; mov 0x14(%ebp),%esi
- DB 139,85,12 ; mov 0xc(%ebp),%edx
- DB 141,122,4 ; lea 0x4(%edx),%edi
- DB 137,125,240 ; mov %edi,-0x10(%ebp)
- DB 139,58 ; mov (%edx),%edi
- DB 243,15,16,23 ; movss (%edi),%xmm2
- DB 243,15,16,79,4 ; movss 0x4(%edi),%xmm1
- DB 15,198,210,0 ; shufps $0x0,%xmm2,%xmm2
- DB 243,15,16,119,48 ; movss 0x30(%edi),%xmm6
+ DB 139,69,12 ; mov 0xc(%ebp),%eax
+ DB 141,72,4 ; lea 0x4(%eax),%ecx
+ DB 137,77,252 ; mov %ecx,-0x4(%ebp)
+ DB 139,8 ; mov (%eax),%ecx
+ DB 243,15,16,33 ; movss (%ecx),%xmm4
+ DB 243,15,16,73,4 ; movss 0x4(%ecx),%xmm1
+ DB 15,198,228,0 ; shufps $0x0,%xmm4,%xmm4
+ DB 243,15,16,113,48 ; movss 0x30(%ecx),%xmm6
DB 15,198,246,0 ; shufps $0x0,%xmm6,%xmm6
- DB 243,15,16,127,64 ; movss 0x40(%edi),%xmm7
+ DB 243,15,16,121,64 ; movss 0x40(%ecx),%xmm7
DB 15,198,255,0 ; shufps $0x0,%xmm7,%xmm7
DB 15,89,243 ; mulps %xmm3,%xmm6
DB 15,88,247 ; addps %xmm7,%xmm6
- DB 243,15,16,127,32 ; movss 0x20(%edi),%xmm7
+ DB 243,15,16,121,32 ; movss 0x20(%ecx),%xmm7
DB 15,198,255,0 ; shufps $0x0,%xmm7,%xmm7
- DB 15,89,252 ; mulps %xmm4,%xmm7
+ DB 15,89,250 ; mulps %xmm2,%xmm7
DB 15,88,254 ; addps %xmm6,%xmm7
- DB 243,15,16,119,16 ; movss 0x10(%edi),%xmm6
+ DB 243,15,16,113,16 ; movss 0x10(%ecx),%xmm6
DB 15,198,246,0 ; shufps $0x0,%xmm6,%xmm6
DB 15,89,245 ; mulps %xmm5,%xmm6
DB 15,88,247 ; addps %xmm7,%xmm6
- DB 15,89,208 ; mulps %xmm0,%xmm2
- DB 15,88,214 ; addps %xmm6,%xmm2
+ DB 15,89,224 ; mulps %xmm0,%xmm4
+ DB 15,88,230 ; addps %xmm6,%xmm4
DB 15,198,201,0 ; shufps $0x0,%xmm1,%xmm1
- DB 243,15,16,119,52 ; movss 0x34(%edi),%xmm6
+ DB 243,15,16,113,52 ; movss 0x34(%ecx),%xmm6
DB 15,198,246,0 ; shufps $0x0,%xmm6,%xmm6
- DB 243,15,16,127,68 ; movss 0x44(%edi),%xmm7
+ DB 243,15,16,121,68 ; movss 0x44(%ecx),%xmm7
DB 15,198,255,0 ; shufps $0x0,%xmm7,%xmm7
DB 15,89,243 ; mulps %xmm3,%xmm6
DB 15,88,247 ; addps %xmm7,%xmm6
- DB 243,15,16,127,36 ; movss 0x24(%edi),%xmm7
+ DB 243,15,16,121,36 ; movss 0x24(%ecx),%xmm7
DB 15,198,255,0 ; shufps $0x0,%xmm7,%xmm7
- DB 15,89,252 ; mulps %xmm4,%xmm7
+ DB 15,89,250 ; mulps %xmm2,%xmm7
DB 15,88,254 ; addps %xmm6,%xmm7
- DB 243,15,16,119,20 ; movss 0x14(%edi),%xmm6
+ DB 243,15,16,113,20 ; movss 0x14(%ecx),%xmm6
DB 15,198,246,0 ; shufps $0x0,%xmm6,%xmm6
DB 15,89,245 ; mulps %xmm5,%xmm6
- DB 15,41,109,216 ; movaps %xmm5,-0x28(%ebp)
DB 15,88,247 ; addps %xmm7,%xmm6
DB 15,89,200 ; mulps %xmm0,%xmm1
DB 15,88,206 ; addps %xmm6,%xmm1
- DB 243,15,16,119,56 ; movss 0x38(%edi),%xmm6
+ DB 243,15,16,113,56 ; movss 0x38(%ecx),%xmm6
DB 15,198,246,0 ; shufps $0x0,%xmm6,%xmm6
- DB 243,15,16,127,72 ; movss 0x48(%edi),%xmm7
+ DB 243,15,16,121,72 ; movss 0x48(%ecx),%xmm7
DB 15,198,255,0 ; shufps $0x0,%xmm7,%xmm7
DB 15,89,243 ; mulps %xmm3,%xmm6
DB 15,88,247 ; addps %xmm7,%xmm6
- DB 243,15,16,127,40 ; movss 0x28(%edi),%xmm7
+ DB 243,15,16,121,40 ; movss 0x28(%ecx),%xmm7
DB 15,198,255,0 ; shufps $0x0,%xmm7,%xmm7
- DB 15,89,252 ; mulps %xmm4,%xmm7
+ DB 15,89,250 ; mulps %xmm2,%xmm7
DB 15,88,254 ; addps %xmm6,%xmm7
- DB 243,15,16,119,24 ; movss 0x18(%edi),%xmm6
+ DB 243,15,16,113,24 ; movss 0x18(%ecx),%xmm6
DB 15,198,246,0 ; shufps $0x0,%xmm6,%xmm6
DB 15,89,245 ; mulps %xmm5,%xmm6
DB 15,88,247 ; addps %xmm7,%xmm6
- DB 243,15,16,127,8 ; movss 0x8(%edi),%xmm7
+ DB 243,15,16,121,8 ; movss 0x8(%ecx),%xmm7
DB 15,198,255,0 ; shufps $0x0,%xmm7,%xmm7
DB 15,89,248 ; mulps %xmm0,%xmm7
- DB 15,40,232 ; movaps %xmm0,%xmm5
DB 15,88,254 ; addps %xmm6,%xmm7
- DB 243,15,16,119,60 ; movss 0x3c(%edi),%xmm6
+ DB 243,15,16,113,60 ; movss 0x3c(%ecx),%xmm6
DB 15,198,246,0 ; shufps $0x0,%xmm6,%xmm6
DB 15,89,243 ; mulps %xmm3,%xmm6
- DB 243,15,16,95,76 ; movss 0x4c(%edi),%xmm3
+ DB 243,15,16,89,76 ; movss 0x4c(%ecx),%xmm3
DB 15,198,219,0 ; shufps $0x0,%xmm3,%xmm3
DB 15,88,243 ; addps %xmm3,%xmm6
- DB 243,15,16,71,44 ; movss 0x2c(%edi),%xmm0
- DB 15,198,192,0 ; shufps $0x0,%xmm0,%xmm0
- DB 15,89,196 ; mulps %xmm4,%xmm0
- DB 243,15,16,95,12 ; movss 0xc(%edi),%xmm3
- DB 15,88,198 ; addps %xmm6,%xmm0
- DB 243,15,16,103,28 ; movss 0x1c(%edi),%xmm4
- DB 139,125,24 ; mov 0x18(%ebp),%edi
- DB 15,198,228,0 ; shufps $0x0,%xmm4,%xmm4
- DB 15,89,101,216 ; mulps -0x28(%ebp),%xmm4
- DB 15,88,224 ; addps %xmm0,%xmm4
- DB 15,40,69,56 ; movaps 0x38(%ebp),%xmm0
+ DB 243,15,16,89,44 ; movss 0x2c(%ecx),%xmm3
DB 15,198,219,0 ; shufps $0x0,%xmm3,%xmm3
- DB 15,89,221 ; mulps %xmm5,%xmm3
- DB 15,40,117,72 ; movaps 0x48(%ebp),%xmm6
- DB 15,88,220 ; addps %xmm4,%xmm3
- DB 15,40,101,88 ; movaps 0x58(%ebp),%xmm4
- DB 141,90,8 ; lea 0x8(%edx),%ebx
- DB 15,41,100,36,80 ; movaps %xmm4,0x50(%esp)
- DB 15,41,116,36,64 ; movaps %xmm6,0x40(%esp)
- DB 15,41,68,36,48 ; movaps %xmm0,0x30(%esp)
- DB 15,40,69,40 ; movaps 0x28(%ebp),%xmm0
- DB 15,41,68,36,32 ; movaps %xmm0,0x20(%esp)
- DB 137,124,36,16 ; mov %edi,0x10(%esp)
- DB 137,116,36,12 ; mov %esi,0xc(%esp)
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
- DB 15,40,194 ; movaps %xmm2,%xmm0
+ DB 15,89,218 ; mulps %xmm2,%xmm3
+ DB 15,88,222 ; addps %xmm6,%xmm3
+ DB 243,15,16,81,28 ; movss 0x1c(%ecx),%xmm2
+ DB 15,198,210,0 ; shufps $0x0,%xmm2,%xmm2
+ DB 15,89,213 ; mulps %xmm5,%xmm2
+ DB 15,88,211 ; addps %xmm3,%xmm2
+ DB 243,15,16,89,12 ; movss 0xc(%ecx),%xmm3
+ DB 15,198,219,0 ; shufps $0x0,%xmm3,%xmm3
+ DB 15,89,216 ; mulps %xmm0,%xmm3
+ DB 15,88,218 ; addps %xmm2,%xmm3
+ DB 139,77,8 ; mov 0x8(%ebp),%ecx
+ DB 141,80,8 ; lea 0x8(%eax),%edx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 15,40,196 ; movaps %xmm4,%xmm0
DB 15,40,215 ; movaps %xmm7,%xmm2
- DB 255,82,4 ; call *0x4(%edx)
- DB 131,196,124 ; add $0x7c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 82 ; push %edx
+ DB 81 ; push %ecx
+ DB 255,80,4 ; call *0x4(%eax)
+ DB 131,196,24 ; add $0x18,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -45755,77 +43819,57 @@ PUBLIC _sk_matrix_4x3_sse2
_sk_matrix_4x3_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
+ DB 131,236,8 ; sub $0x8,%esp
DB 15,40,233 ; movaps %xmm1,%xmm5
DB 15,40,224 ; movaps %xmm0,%xmm4
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
- DB 139,117,20 ; mov 0x14(%ebp),%esi
- DB 139,85,12 ; mov 0xc(%ebp),%edx
- DB 139,58 ; mov (%edx),%edi
- DB 243,15,16,7 ; movss (%edi),%xmm0
- DB 243,15,16,79,4 ; movss 0x4(%edi),%xmm1
+ DB 139,69,12 ; mov 0xc(%ebp),%eax
+ DB 139,8 ; mov (%eax),%ecx
+ DB 243,15,16,1 ; movss (%ecx),%xmm0
+ DB 243,15,16,73,4 ; movss 0x4(%ecx),%xmm1
DB 15,198,192,0 ; shufps $0x0,%xmm0,%xmm0
- DB 243,15,16,87,16 ; movss 0x10(%edi),%xmm2
+ DB 243,15,16,81,16 ; movss 0x10(%ecx),%xmm2
DB 15,198,210,0 ; shufps $0x0,%xmm2,%xmm2
- DB 243,15,16,95,32 ; movss 0x20(%edi),%xmm3
+ DB 243,15,16,89,32 ; movss 0x20(%ecx),%xmm3
DB 15,198,219,0 ; shufps $0x0,%xmm3,%xmm3
DB 15,89,213 ; mulps %xmm5,%xmm2
DB 15,88,211 ; addps %xmm3,%xmm2
DB 15,89,196 ; mulps %xmm4,%xmm0
DB 15,88,194 ; addps %xmm2,%xmm0
DB 15,198,201,0 ; shufps $0x0,%xmm1,%xmm1
- DB 243,15,16,87,20 ; movss 0x14(%edi),%xmm2
+ DB 243,15,16,81,20 ; movss 0x14(%ecx),%xmm2
DB 15,198,210,0 ; shufps $0x0,%xmm2,%xmm2
- DB 243,15,16,95,36 ; movss 0x24(%edi),%xmm3
+ DB 243,15,16,89,36 ; movss 0x24(%ecx),%xmm3
DB 15,198,219,0 ; shufps $0x0,%xmm3,%xmm3
DB 15,89,213 ; mulps %xmm5,%xmm2
DB 15,88,211 ; addps %xmm3,%xmm2
DB 15,89,204 ; mulps %xmm4,%xmm1
DB 15,88,202 ; addps %xmm2,%xmm1
- DB 243,15,16,87,8 ; movss 0x8(%edi),%xmm2
+ DB 243,15,16,81,8 ; movss 0x8(%ecx),%xmm2
DB 15,198,210,0 ; shufps $0x0,%xmm2,%xmm2
- DB 243,15,16,95,24 ; movss 0x18(%edi),%xmm3
+ DB 243,15,16,89,24 ; movss 0x18(%ecx),%xmm3
DB 15,198,219,0 ; shufps $0x0,%xmm3,%xmm3
- DB 243,15,16,119,40 ; movss 0x28(%edi),%xmm6
+ DB 243,15,16,113,40 ; movss 0x28(%ecx),%xmm6
DB 15,198,246,0 ; shufps $0x0,%xmm6,%xmm6
DB 15,89,221 ; mulps %xmm5,%xmm3
DB 15,88,222 ; addps %xmm6,%xmm3
DB 15,89,212 ; mulps %xmm4,%xmm2
DB 15,88,211 ; addps %xmm3,%xmm2
- DB 243,15,16,95,12 ; movss 0xc(%edi),%xmm3
- DB 243,15,16,119,28 ; movss 0x1c(%edi),%xmm6
- DB 243,15,16,127,44 ; movss 0x2c(%edi),%xmm7
- DB 139,125,24 ; mov 0x18(%ebp),%edi
+ DB 243,15,16,89,12 ; movss 0xc(%ecx),%xmm3
+ DB 15,198,219,0 ; shufps $0x0,%xmm3,%xmm3
+ DB 243,15,16,113,28 ; movss 0x1c(%ecx),%xmm6
DB 15,198,246,0 ; shufps $0x0,%xmm6,%xmm6
- DB 15,89,245 ; mulps %xmm5,%xmm6
- DB 15,40,109,40 ; movaps 0x28(%ebp),%xmm5
+ DB 243,15,16,121,44 ; movss 0x2c(%ecx),%xmm7
DB 15,198,255,0 ; shufps $0x0,%xmm7,%xmm7
+ DB 15,89,245 ; mulps %xmm5,%xmm6
DB 15,88,247 ; addps %xmm7,%xmm6
- DB 15,40,125,56 ; movaps 0x38(%ebp),%xmm7
- DB 15,198,219,0 ; shufps $0x0,%xmm3,%xmm3
DB 15,89,220 ; mulps %xmm4,%xmm3
- DB 15,40,101,72 ; movaps 0x48(%ebp),%xmm4
DB 15,88,222 ; addps %xmm6,%xmm3
- DB 15,40,117,88 ; movaps 0x58(%ebp),%xmm6
- DB 141,90,8 ; lea 0x8(%edx),%ebx
- DB 15,41,116,36,80 ; movaps %xmm6,0x50(%esp)
- DB 15,41,100,36,64 ; movaps %xmm4,0x40(%esp)
- DB 15,41,124,36,48 ; movaps %xmm7,0x30(%esp)
- DB 15,41,108,36,32 ; movaps %xmm5,0x20(%esp)
- DB 137,124,36,16 ; mov %edi,0x10(%esp)
- DB 137,116,36,12 ; mov %esi,0xc(%esp)
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
- DB 255,82,4 ; call *0x4(%edx)
- DB 131,196,108 ; add $0x6c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 141,72,8 ; lea 0x8(%eax),%ecx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 81 ; push %ecx
+ DB 255,117,8 ; pushl 0x8(%ebp)
+ DB 255,80,4 ; call *0x4(%eax)
+ DB 131,196,24 ; add $0x18,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -45833,70 +43877,50 @@ PUBLIC _sk_matrix_perspective_sse2
_sk_matrix_perspective_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
+ DB 131,236,8 ; sub $0x8,%esp
DB 15,40,224 ; movaps %xmm0,%xmm4
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
- DB 139,117,20 ; mov 0x14(%ebp),%esi
- DB 139,85,12 ; mov 0xc(%ebp),%edx
- DB 139,58 ; mov (%edx),%edi
- DB 243,15,16,7 ; movss (%edi),%xmm0
- DB 243,15,16,111,4 ; movss 0x4(%edi),%xmm5
+ DB 139,69,12 ; mov 0xc(%ebp),%eax
+ DB 139,8 ; mov (%eax),%ecx
+ DB 243,15,16,1 ; movss (%ecx),%xmm0
+ DB 243,15,16,105,4 ; movss 0x4(%ecx),%xmm5
DB 15,198,192,0 ; shufps $0x0,%xmm0,%xmm0
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
- DB 243,15,16,119,8 ; movss 0x8(%edi),%xmm6
+ DB 243,15,16,113,8 ; movss 0x8(%ecx),%xmm6
DB 15,198,246,0 ; shufps $0x0,%xmm6,%xmm6
DB 15,89,233 ; mulps %xmm1,%xmm5
DB 15,88,238 ; addps %xmm6,%xmm5
DB 15,89,196 ; mulps %xmm4,%xmm0
DB 15,88,197 ; addps %xmm5,%xmm0
- DB 243,15,16,111,12 ; movss 0xc(%edi),%xmm5
- DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
- DB 243,15,16,119,16 ; movss 0x10(%edi),%xmm6
+ DB 243,15,16,113,16 ; movss 0x10(%ecx),%xmm6
DB 15,198,246,0 ; shufps $0x0,%xmm6,%xmm6
- DB 243,15,16,127,20 ; movss 0x14(%edi),%xmm7
- DB 15,198,255,0 ; shufps $0x0,%xmm7,%xmm7
+ DB 243,15,16,105,20 ; movss 0x14(%ecx),%xmm5
+ DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
DB 15,89,241 ; mulps %xmm1,%xmm6
- DB 15,88,247 ; addps %xmm7,%xmm6
+ DB 15,88,245 ; addps %xmm5,%xmm6
+ DB 243,15,16,105,12 ; movss 0xc(%ecx),%xmm5
+ DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
DB 15,89,236 ; mulps %xmm4,%xmm5
DB 15,88,238 ; addps %xmm6,%xmm5
- DB 243,15,16,119,24 ; movss 0x18(%edi),%xmm6
- DB 243,15,16,127,28 ; movss 0x1c(%edi),%xmm7
- DB 15,198,255,0 ; shufps $0x0,%xmm7,%xmm7
- DB 15,89,249 ; mulps %xmm1,%xmm7
- DB 243,15,16,79,32 ; movss 0x20(%edi),%xmm1
- DB 139,125,24 ; mov 0x18(%ebp),%edi
- DB 15,198,201,0 ; shufps $0x0,%xmm1,%xmm1
- DB 15,88,249 ; addps %xmm1,%xmm7
- DB 15,40,77,40 ; movaps 0x28(%ebp),%xmm1
+ DB 243,15,16,113,28 ; movss 0x1c(%ecx),%xmm6
DB 15,198,246,0 ; shufps $0x0,%xmm6,%xmm6
- DB 15,89,244 ; mulps %xmm4,%xmm6
- DB 15,40,101,56 ; movaps 0x38(%ebp),%xmm4
- DB 15,88,247 ; addps %xmm7,%xmm6
- DB 15,40,125,72 ; movaps 0x48(%ebp),%xmm7
- DB 15,83,246 ; rcpps %xmm6,%xmm6
- DB 15,89,198 ; mulps %xmm6,%xmm0
- DB 15,89,238 ; mulps %xmm6,%xmm5
- DB 15,40,117,88 ; movaps 0x58(%ebp),%xmm6
- DB 141,90,8 ; lea 0x8(%edx),%ebx
- DB 15,41,116,36,80 ; movaps %xmm6,0x50(%esp)
- DB 15,41,124,36,64 ; movaps %xmm7,0x40(%esp)
- DB 15,41,100,36,48 ; movaps %xmm4,0x30(%esp)
- DB 15,41,76,36,32 ; movaps %xmm1,0x20(%esp)
- DB 137,124,36,16 ; mov %edi,0x10(%esp)
- DB 137,116,36,12 ; mov %esi,0xc(%esp)
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
+ DB 15,89,241 ; mulps %xmm1,%xmm6
+ DB 243,15,16,73,32 ; movss 0x20(%ecx),%xmm1
+ DB 15,198,201,0 ; shufps $0x0,%xmm1,%xmm1
+ DB 15,88,241 ; addps %xmm1,%xmm6
+ DB 243,15,16,73,24 ; movss 0x18(%ecx),%xmm1
+ DB 15,198,201,0 ; shufps $0x0,%xmm1,%xmm1
+ DB 15,89,204 ; mulps %xmm4,%xmm1
+ DB 15,88,206 ; addps %xmm6,%xmm1
+ DB 15,83,201 ; rcpps %xmm1,%xmm1
+ DB 15,89,193 ; mulps %xmm1,%xmm0
+ DB 15,89,233 ; mulps %xmm1,%xmm5
+ DB 141,72,8 ; lea 0x8(%eax),%ecx
+ DB 131,236,8 ; sub $0x8,%esp
DB 15,40,205 ; movaps %xmm5,%xmm1
- DB 255,82,4 ; call *0x4(%edx)
- DB 131,196,108 ; add $0x6c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 81 ; push %ecx
+ DB 255,117,8 ; pushl 0x8(%ebp)
+ DB 255,80,4 ; call *0x4(%eax)
+ DB 131,196,24 ; add $0x18,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -45907,9 +43931,9 @@ _sk_evenly_spaced_gradient_sse2 LABEL PROC
DB 83 ; push %ebx
DB 87 ; push %edi
DB 86 ; push %esi
- DB 129,236,156,0,0,0 ; sub $0x9c,%esp
+ DB 131,236,60 ; sub $0x3c,%esp
DB 15,41,69,184 ; movaps %xmm0,-0x48(%ebp)
- DB 232,0,0,0,0 ; call 7e12 <_sk_evenly_spaced_gradient_sse2+0x15>
+ DB 232,0,0,0,0 ; call 61c6 <_sk_evenly_spaced_gradient_sse2+0x12>
DB 90 ; pop %edx
DB 139,77,12 ; mov 0xc(%ebp),%ecx
DB 141,65,4 ; lea 0x4(%ecx),%eax
@@ -45920,12 +43944,12 @@ _sk_evenly_spaced_gradient_sse2 LABEL PROC
DB 78 ; dec %esi
DB 102,15,110,206 ; movd %esi,%xmm1
DB 102,15,112,201,0 ; pshufd $0x0,%xmm1,%xmm1
- DB 102,15,111,146,62,36,0,0 ; movdqa 0x243e(%edx),%xmm2
+ DB 102,15,111,146,170,29,0,0 ; movdqa 0x1daa(%edx),%xmm2
DB 102,15,219,209 ; pand %xmm1,%xmm2
- DB 102,15,235,146,78,36,0,0 ; por 0x244e(%edx),%xmm2
+ DB 102,15,235,146,186,29,0,0 ; por 0x1dba(%edx),%xmm2
DB 102,15,114,209,16 ; psrld $0x10,%xmm1
- DB 102,15,235,138,94,36,0,0 ; por 0x245e(%edx),%xmm1
- DB 15,88,138,110,36,0,0 ; addps 0x246e(%edx),%xmm1
+ DB 102,15,235,138,202,29,0,0 ; por 0x1dca(%edx),%xmm1
+ DB 15,88,138,218,29,0,0 ; addps 0x1dda(%edx),%xmm1
DB 15,88,202 ; addps %xmm2,%xmm1
DB 15,89,200 ; mulps %xmm0,%xmm1
DB 243,15,91,201 ; cvttps2dq %xmm1,%xmm1
@@ -46001,37 +44025,24 @@ _sk_evenly_spaced_gradient_sse2 LABEL PROC
DB 243,15,16,52,152 ; movss (%eax,%ebx,4),%xmm6
DB 15,20,198 ; unpcklps %xmm6,%xmm0
DB 15,20,197 ; unpcklps %xmm5,%xmm0
- DB 15,40,117,184 ; movaps -0x48(%ebp),%xmm6
- DB 15,89,230 ; mulps %xmm6,%xmm4
+ DB 15,40,109,184 ; movaps -0x48(%ebp),%xmm5
+ DB 15,89,229 ; mulps %xmm5,%xmm4
DB 15,88,101,200 ; addps -0x38(%ebp),%xmm4
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
- DB 139,85,20 ; mov 0x14(%ebp),%edx
- DB 139,117,24 ; mov 0x18(%ebp),%esi
- DB 15,89,206 ; mulps %xmm6,%xmm1
+ DB 15,89,205 ; mulps %xmm5,%xmm1
DB 15,88,77,216 ; addps -0x28(%ebp),%xmm1
- DB 15,89,214 ; mulps %xmm6,%xmm2
+ DB 15,89,213 ; mulps %xmm5,%xmm2
DB 15,88,215 ; addps %xmm7,%xmm2
- DB 15,40,109,56 ; movaps 0x38(%ebp),%xmm5
- DB 15,89,222 ; mulps %xmm6,%xmm3
- DB 15,40,125,72 ; movaps 0x48(%ebp),%xmm7
+ DB 15,89,221 ; mulps %xmm5,%xmm3
DB 15,88,216 ; addps %xmm0,%xmm3
- DB 15,40,69,88 ; movaps 0x58(%ebp),%xmm0
- DB 139,93,12 ; mov 0xc(%ebp),%ebx
- DB 141,123,8 ; lea 0x8(%ebx),%edi
- DB 15,41,68,36,80 ; movaps %xmm0,0x50(%esp)
- DB 15,41,124,36,64 ; movaps %xmm7,0x40(%esp)
- DB 15,41,108,36,48 ; movaps %xmm5,0x30(%esp)
- DB 15,40,69,40 ; movaps 0x28(%ebp),%xmm0
- DB 15,41,68,36,32 ; movaps %xmm0,0x20(%esp)
- DB 137,116,36,16 ; mov %esi,0x10(%esp)
- DB 137,84,36,12 ; mov %edx,0xc(%esp)
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,124,36,4 ; mov %edi,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
+ DB 139,69,8 ; mov 0x8(%ebp),%eax
+ DB 139,85,12 ; mov 0xc(%ebp),%edx
+ DB 141,74,8 ; lea 0x8(%edx),%ecx
+ DB 131,236,8 ; sub $0x8,%esp
DB 15,40,196 ; movaps %xmm4,%xmm0
- DB 255,83,4 ; call *0x4(%ebx)
- DB 129,196,156,0,0,0 ; add $0x9c,%esp
+ DB 81 ; push %ecx
+ DB 80 ; push %eax
+ DB 255,82,4 ; call *0x4(%edx)
+ DB 131,196,76 ; add $0x4c,%esp
DB 94 ; pop %esi
DB 95 ; pop %edi
DB 91 ; pop %ebx
@@ -46042,48 +44053,28 @@ PUBLIC _sk_gauss_a_to_rgba_sse2
_sk_gauss_a_to_rgba_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 232,0,0,0,0 ; call 8009 <_sk_gauss_a_to_rgba_sse2+0xe>
- DB 90 ; pop %edx
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
- DB 139,117,20 ; mov 0x14(%ebp),%esi
- DB 139,125,24 ; mov 0x18(%ebp),%edi
- DB 15,40,77,40 ; movaps 0x28(%ebp),%xmm1
- DB 15,40,85,56 ; movaps 0x38(%ebp),%xmm2
- DB 15,40,101,72 ; movaps 0x48(%ebp),%xmm4
- DB 15,40,109,88 ; movaps 0x58(%ebp),%xmm5
- DB 15,40,130,135,34,0,0 ; movaps 0x2287(%edx),%xmm0
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 232,0,0,0,0 ; call 637c <_sk_gauss_a_to_rgba_sse2+0xb>
+ DB 88 ; pop %eax
+ DB 139,77,12 ; mov 0xc(%ebp),%ecx
+ DB 15,40,128,52,28,0,0 ; movaps 0x1c34(%eax),%xmm0
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,130,151,34,0,0 ; addps 0x2297(%edx),%xmm0
+ DB 15,88,128,68,28,0,0 ; addps 0x1c44(%eax),%xmm0
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,130,167,34,0,0 ; addps 0x22a7(%edx),%xmm0
+ DB 15,88,128,84,28,0,0 ; addps 0x1c54(%eax),%xmm0
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,130,183,34,0,0 ; addps 0x22b7(%edx),%xmm0
+ DB 15,88,128,100,28,0,0 ; addps 0x1c64(%eax),%xmm0
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,130,199,34,0,0 ; addps 0x22c7(%edx),%xmm0
- DB 139,85,12 ; mov 0xc(%ebp),%edx
- DB 141,90,4 ; lea 0x4(%edx),%ebx
- DB 15,41,108,36,80 ; movaps %xmm5,0x50(%esp)
- DB 15,41,100,36,64 ; movaps %xmm4,0x40(%esp)
- DB 15,41,84,36,48 ; movaps %xmm2,0x30(%esp)
- DB 15,41,76,36,32 ; movaps %xmm1,0x20(%esp)
- DB 137,124,36,16 ; mov %edi,0x10(%esp)
- DB 137,116,36,12 ; mov %esi,0xc(%esp)
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
+ DB 15,88,128,116,28,0,0 ; addps 0x1c74(%eax),%xmm0
+ DB 141,65,4 ; lea 0x4(%ecx),%eax
+ DB 131,236,8 ; sub $0x8,%esp
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 15,40,216 ; movaps %xmm0,%xmm3
- DB 255,18 ; call *(%edx)
- DB 131,196,108 ; add $0x6c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 80 ; push %eax
+ DB 255,117,8 ; pushl 0x8(%ebp)
+ DB 255,17 ; call *(%ecx)
+ DB 131,196,24 ; add $0x18,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -46094,102 +44085,102 @@ _sk_gradient_sse2 LABEL PROC
DB 83 ; push %ebx
DB 87 ; push %edi
DB 86 ; push %esi
- DB 129,236,156,0,0,0 ; sub $0x9c,%esp
- DB 232,0,0,0,0 ; call 80a6 <_sk_gradient_sse2+0x11>
- DB 90 ; pop %edx
- DB 139,69,12 ; mov 0xc(%ebp),%eax
- DB 141,72,4 ; lea 0x4(%eax),%ecx
- DB 137,77,240 ; mov %ecx,-0x10(%ebp)
- DB 139,56 ; mov (%eax),%edi
- DB 139,7 ; mov (%edi),%eax
+ DB 131,236,60 ; sub $0x3c,%esp
+ DB 232,0,0,0,0 ; call 63d7 <_sk_gradient_sse2+0xe>
+ DB 95 ; pop %edi
+ DB 139,77,12 ; mov 0xc(%ebp),%ecx
+ DB 141,81,4 ; lea 0x4(%ecx),%edx
+ DB 137,85,240 ; mov %edx,-0x10(%ebp)
+ DB 139,9 ; mov (%ecx),%ecx
+ DB 139,17 ; mov (%ecx),%edx
DB 102,15,239,201 ; pxor %xmm1,%xmm1
- DB 131,248,2 ; cmp $0x2,%eax
- DB 114,43 ; jb 80e8 <_sk_gradient_sse2+0x53>
- DB 139,79,36 ; mov 0x24(%edi),%ecx
- DB 72 ; dec %eax
- DB 131,193,4 ; add $0x4,%ecx
+ DB 131,250,2 ; cmp $0x2,%edx
+ DB 114,43 ; jb 6419 <_sk_gradient_sse2+0x50>
+ DB 139,113,36 ; mov 0x24(%ecx),%esi
+ DB 74 ; dec %edx
+ DB 131,198,4 ; add $0x4,%esi
DB 102,15,239,201 ; pxor %xmm1,%xmm1
- DB 15,40,146,58,34,0,0 ; movaps 0x223a(%edx),%xmm2
- DB 243,15,16,25 ; movss (%ecx),%xmm3
+ DB 15,40,151,41,28,0,0 ; movaps 0x1c29(%edi),%xmm2
+ DB 243,15,16,30 ; movss (%esi),%xmm3
DB 15,198,219,0 ; shufps $0x0,%xmm3,%xmm3
DB 15,194,216,2 ; cmpleps %xmm0,%xmm3
DB 15,84,218 ; andps %xmm2,%xmm3
DB 102,15,254,203 ; paddd %xmm3,%xmm1
- DB 131,193,4 ; add $0x4,%ecx
- DB 72 ; dec %eax
- DB 117,231 ; jne 80cf <_sk_gradient_sse2+0x3a>
- DB 102,15,126,203 ; movd %xmm1,%ebx
+ DB 131,198,4 ; add $0x4,%esi
+ DB 74 ; dec %edx
+ DB 117,231 ; jne 6400 <_sk_gradient_sse2+0x37>
+ DB 102,15,126,202 ; movd %xmm1,%edx
DB 102,15,112,209,229 ; pshufd $0xe5,%xmm1,%xmm2
- DB 102,15,126,208 ; movd %xmm2,%eax
+ DB 102,15,126,214 ; movd %xmm2,%esi
DB 102,15,112,209,78 ; pshufd $0x4e,%xmm1,%xmm2
DB 102,15,112,201,231 ; pshufd $0xe7,%xmm1,%xmm1
- DB 102,15,126,201 ; movd %xmm1,%ecx
- DB 139,119,4 ; mov 0x4(%edi),%esi
- DB 243,15,16,12,142 ; movss (%esi,%ecx,4),%xmm1
- DB 243,15,16,28,134 ; movss (%esi,%eax,4),%xmm3
- DB 243,15,16,36,158 ; movss (%esi,%ebx,4),%xmm4
- DB 102,15,126,210 ; movd %xmm2,%edx
- DB 243,15,16,20,150 ; movss (%esi,%edx,4),%xmm2
+ DB 102,15,126,207 ; movd %xmm1,%edi
+ DB 139,65,4 ; mov 0x4(%ecx),%eax
+ DB 243,15,16,12,184 ; movss (%eax,%edi,4),%xmm1
+ DB 243,15,16,28,176 ; movss (%eax,%esi,4),%xmm3
+ DB 243,15,16,36,144 ; movss (%eax,%edx,4),%xmm4
+ DB 102,15,126,211 ; movd %xmm2,%ebx
+ DB 243,15,16,20,152 ; movss (%eax,%ebx,4),%xmm2
DB 15,20,217 ; unpcklps %xmm1,%xmm3
- DB 139,119,20 ; mov 0x14(%edi),%esi
- DB 243,15,16,12,142 ; movss (%esi,%ecx,4),%xmm1
- DB 243,15,16,52,134 ; movss (%esi,%eax,4),%xmm6
- DB 243,15,16,44,158 ; movss (%esi,%ebx,4),%xmm5
- DB 243,15,16,60,150 ; movss (%esi,%edx,4),%xmm7
+ DB 139,65,20 ; mov 0x14(%ecx),%eax
+ DB 243,15,16,12,184 ; movss (%eax,%edi,4),%xmm1
+ DB 243,15,16,52,176 ; movss (%eax,%esi,4),%xmm6
+ DB 243,15,16,44,144 ; movss (%eax,%edx,4),%xmm5
+ DB 243,15,16,60,152 ; movss (%eax,%ebx,4),%xmm7
DB 15,20,226 ; unpcklps %xmm2,%xmm4
DB 15,20,227 ; unpcklps %xmm3,%xmm4
DB 15,41,101,184 ; movaps %xmm4,-0x48(%ebp)
DB 15,20,241 ; unpcklps %xmm1,%xmm6
DB 15,20,239 ; unpcklps %xmm7,%xmm5
- DB 139,119,8 ; mov 0x8(%edi),%esi
- DB 243,15,16,20,142 ; movss (%esi,%ecx,4),%xmm2
- DB 243,15,16,28,134 ; movss (%esi,%eax,4),%xmm3
- DB 243,15,16,12,158 ; movss (%esi,%ebx,4),%xmm1
- DB 243,15,16,60,150 ; movss (%esi,%edx,4),%xmm7
+ DB 139,65,8 ; mov 0x8(%ecx),%eax
+ DB 243,15,16,20,184 ; movss (%eax,%edi,4),%xmm2
+ DB 243,15,16,28,176 ; movss (%eax,%esi,4),%xmm3
+ DB 243,15,16,12,144 ; movss (%eax,%edx,4),%xmm1
+ DB 243,15,16,60,152 ; movss (%eax,%ebx,4),%xmm7
DB 15,20,238 ; unpcklps %xmm6,%xmm5
DB 15,41,109,200 ; movaps %xmm5,-0x38(%ebp)
DB 15,20,218 ; unpcklps %xmm2,%xmm3
DB 15,20,207 ; unpcklps %xmm7,%xmm1
DB 15,20,203 ; unpcklps %xmm3,%xmm1
- DB 139,119,24 ; mov 0x18(%edi),%esi
- DB 243,15,16,20,142 ; movss (%esi,%ecx,4),%xmm2
- DB 243,15,16,28,134 ; movss (%esi,%eax,4),%xmm3
- DB 243,15,16,36,158 ; movss (%esi,%ebx,4),%xmm4
- DB 243,15,16,60,150 ; movss (%esi,%edx,4),%xmm7
+ DB 139,65,24 ; mov 0x18(%ecx),%eax
+ DB 243,15,16,20,184 ; movss (%eax,%edi,4),%xmm2
+ DB 243,15,16,28,176 ; movss (%eax,%esi,4),%xmm3
+ DB 243,15,16,36,144 ; movss (%eax,%edx,4),%xmm4
+ DB 243,15,16,60,152 ; movss (%eax,%ebx,4),%xmm7
DB 15,20,218 ; unpcklps %xmm2,%xmm3
DB 15,20,231 ; unpcklps %xmm7,%xmm4
DB 15,20,227 ; unpcklps %xmm3,%xmm4
DB 15,41,101,216 ; movaps %xmm4,-0x28(%ebp)
- DB 139,119,12 ; mov 0xc(%edi),%esi
- DB 243,15,16,20,142 ; movss (%esi,%ecx,4),%xmm2
- DB 243,15,16,28,134 ; movss (%esi,%eax,4),%xmm3
+ DB 139,65,12 ; mov 0xc(%ecx),%eax
+ DB 243,15,16,20,184 ; movss (%eax,%edi,4),%xmm2
+ DB 243,15,16,28,176 ; movss (%eax,%esi,4),%xmm3
DB 15,20,218 ; unpcklps %xmm2,%xmm3
- DB 243,15,16,20,158 ; movss (%esi,%ebx,4),%xmm2
- DB 243,15,16,60,150 ; movss (%esi,%edx,4),%xmm7
+ DB 243,15,16,20,144 ; movss (%eax,%edx,4),%xmm2
+ DB 243,15,16,60,152 ; movss (%eax,%ebx,4),%xmm7
DB 15,20,215 ; unpcklps %xmm7,%xmm2
DB 15,20,211 ; unpcklps %xmm3,%xmm2
- DB 139,119,28 ; mov 0x1c(%edi),%esi
- DB 243,15,16,60,142 ; movss (%esi,%ecx,4),%xmm7
- DB 243,15,16,28,134 ; movss (%esi,%eax,4),%xmm3
+ DB 139,65,28 ; mov 0x1c(%ecx),%eax
+ DB 243,15,16,60,184 ; movss (%eax,%edi,4),%xmm7
+ DB 243,15,16,28,176 ; movss (%eax,%esi,4),%xmm3
DB 15,20,223 ; unpcklps %xmm7,%xmm3
- DB 243,15,16,60,158 ; movss (%esi,%ebx,4),%xmm7
- DB 243,15,16,44,150 ; movss (%esi,%edx,4),%xmm5
+ DB 243,15,16,60,144 ; movss (%eax,%edx,4),%xmm7
+ DB 243,15,16,44,152 ; movss (%eax,%ebx,4),%xmm5
DB 15,20,253 ; unpcklps %xmm5,%xmm7
DB 15,20,251 ; unpcklps %xmm3,%xmm7
- DB 139,119,16 ; mov 0x10(%edi),%esi
- DB 243,15,16,28,142 ; movss (%esi,%ecx,4),%xmm3
- DB 243,15,16,44,134 ; movss (%esi,%eax,4),%xmm5
+ DB 139,65,16 ; mov 0x10(%ecx),%eax
+ DB 243,15,16,28,184 ; movss (%eax,%edi,4),%xmm3
+ DB 243,15,16,44,176 ; movss (%eax,%esi,4),%xmm5
DB 15,20,235 ; unpcklps %xmm3,%xmm5
- DB 243,15,16,28,158 ; movss (%esi,%ebx,4),%xmm3
- DB 243,15,16,52,150 ; movss (%esi,%edx,4),%xmm6
+ DB 243,15,16,28,144 ; movss (%eax,%edx,4),%xmm3
+ DB 243,15,16,52,152 ; movss (%eax,%ebx,4),%xmm6
DB 15,20,222 ; unpcklps %xmm6,%xmm3
DB 15,20,221 ; unpcklps %xmm5,%xmm3
- DB 139,119,32 ; mov 0x20(%edi),%esi
- DB 243,15,16,44,142 ; movss (%esi,%ecx,4),%xmm5
- DB 243,15,16,52,134 ; movss (%esi,%eax,4),%xmm6
+ DB 139,65,32 ; mov 0x20(%ecx),%eax
+ DB 243,15,16,44,184 ; movss (%eax,%edi,4),%xmm5
+ DB 243,15,16,52,176 ; movss (%eax,%esi,4),%xmm6
DB 15,20,245 ; unpcklps %xmm5,%xmm6
- DB 243,15,16,44,158 ; movss (%esi,%ebx,4),%xmm5
- DB 243,15,16,36,150 ; movss (%esi,%edx,4),%xmm4
+ DB 243,15,16,44,144 ; movss (%eax,%edx,4),%xmm5
+ DB 243,15,16,36,152 ; movss (%eax,%ebx,4),%xmm4
DB 15,20,236 ; unpcklps %xmm4,%xmm5
DB 15,20,238 ; unpcklps %xmm6,%xmm5
DB 15,40,101,184 ; movaps -0x48(%ebp),%xmm4
@@ -46203,26 +44194,12 @@ _sk_gradient_sse2 LABEL PROC
DB 15,88,221 ; addps %xmm5,%xmm3
DB 139,69,240 ; mov -0x10(%ebp),%eax
DB 141,72,4 ; lea 0x4(%eax),%ecx
- DB 15,40,69,88 ; movaps 0x58(%ebp),%xmm0
- DB 15,41,68,36,80 ; movaps %xmm0,0x50(%esp)
- DB 15,40,69,72 ; movaps 0x48(%ebp),%xmm0
- DB 15,41,68,36,64 ; movaps %xmm0,0x40(%esp)
- DB 15,40,69,56 ; movaps 0x38(%ebp),%xmm0
- DB 15,41,68,36,48 ; movaps %xmm0,0x30(%esp)
- DB 15,40,69,40 ; movaps 0x28(%ebp),%xmm0
- DB 15,41,68,36,32 ; movaps %xmm0,0x20(%esp)
- DB 139,85,24 ; mov 0x18(%ebp),%edx
- DB 137,84,36,16 ; mov %edx,0x10(%esp)
- DB 139,85,20 ; mov 0x14(%ebp),%edx
- DB 137,84,36,12 ; mov %edx,0xc(%esp)
- DB 139,85,16 ; mov 0x10(%ebp),%edx
- DB 137,84,36,8 ; mov %edx,0x8(%esp)
- DB 137,76,36,4 ; mov %ecx,0x4(%esp)
- DB 139,77,8 ; mov 0x8(%ebp),%ecx
- DB 137,12,36 ; mov %ecx,(%esp)
+ DB 131,236,8 ; sub $0x8,%esp
DB 15,40,196 ; movaps %xmm4,%xmm0
+ DB 81 ; push %ecx
+ DB 255,117,8 ; pushl 0x8(%ebp)
DB 255,16 ; call *(%eax)
- DB 129,196,156,0,0,0 ; add $0x9c,%esp
+ DB 131,196,76 ; add $0x4c,%esp
DB 94 ; pop %esi
DB 95 ; pop %edi
DB 91 ; pop %ebx
@@ -46233,60 +44210,40 @@ PUBLIC _sk_evenly_spaced_2_stop_gradient_sse2
_sk_evenly_spaced_2_stop_gradient_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
+ DB 131,236,8 ; sub $0x8,%esp
DB 15,40,224 ; movaps %xmm0,%xmm4
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
- DB 139,117,20 ; mov 0x14(%ebp),%esi
- DB 139,85,12 ; mov 0xc(%ebp),%edx
- DB 139,58 ; mov (%edx),%edi
- DB 243,15,16,7 ; movss (%edi),%xmm0
- DB 243,15,16,79,4 ; movss 0x4(%edi),%xmm1
+ DB 139,69,12 ; mov 0xc(%ebp),%eax
+ DB 139,8 ; mov (%eax),%ecx
+ DB 243,15,16,1 ; movss (%ecx),%xmm0
+ DB 243,15,16,73,4 ; movss 0x4(%ecx),%xmm1
DB 15,198,192,0 ; shufps $0x0,%xmm0,%xmm0
- DB 243,15,16,87,16 ; movss 0x10(%edi),%xmm2
+ DB 243,15,16,81,16 ; movss 0x10(%ecx),%xmm2
DB 15,198,210,0 ; shufps $0x0,%xmm2,%xmm2
DB 15,89,196 ; mulps %xmm4,%xmm0
DB 15,88,194 ; addps %xmm2,%xmm0
- DB 243,15,16,111,20 ; movss 0x14(%edi),%xmm5
- DB 243,15,16,87,8 ; movss 0x8(%edi),%xmm2
- DB 243,15,16,119,24 ; movss 0x18(%edi),%xmm6
- DB 243,15,16,95,12 ; movss 0xc(%edi),%xmm3
- DB 243,15,16,127,28 ; movss 0x1c(%edi),%xmm7
- DB 139,125,24 ; mov 0x18(%ebp),%edi
DB 15,198,201,0 ; shufps $0x0,%xmm1,%xmm1
- DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
+ DB 243,15,16,81,20 ; movss 0x14(%ecx),%xmm2
+ DB 15,198,210,0 ; shufps $0x0,%xmm2,%xmm2
DB 15,89,204 ; mulps %xmm4,%xmm1
- DB 15,88,205 ; addps %xmm5,%xmm1
- DB 15,40,109,40 ; movaps 0x28(%ebp),%xmm5
+ DB 15,88,202 ; addps %xmm2,%xmm1
+ DB 243,15,16,81,8 ; movss 0x8(%ecx),%xmm2
DB 15,198,210,0 ; shufps $0x0,%xmm2,%xmm2
- DB 15,198,246,0 ; shufps $0x0,%xmm6,%xmm6
+ DB 243,15,16,89,24 ; movss 0x18(%ecx),%xmm3
+ DB 15,198,219,0 ; shufps $0x0,%xmm3,%xmm3
DB 15,89,212 ; mulps %xmm4,%xmm2
- DB 15,88,214 ; addps %xmm6,%xmm2
- DB 15,40,117,56 ; movaps 0x38(%ebp),%xmm6
+ DB 15,88,211 ; addps %xmm3,%xmm2
+ DB 243,15,16,89,12 ; movss 0xc(%ecx),%xmm3
DB 15,198,219,0 ; shufps $0x0,%xmm3,%xmm3
+ DB 243,15,16,105,28 ; movss 0x1c(%ecx),%xmm5
+ DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
DB 15,89,220 ; mulps %xmm4,%xmm3
- DB 15,40,101,72 ; movaps 0x48(%ebp),%xmm4
- DB 15,198,255,0 ; shufps $0x0,%xmm7,%xmm7
- DB 15,88,223 ; addps %xmm7,%xmm3
- DB 15,40,125,88 ; movaps 0x58(%ebp),%xmm7
- DB 141,90,8 ; lea 0x8(%edx),%ebx
- DB 15,41,124,36,80 ; movaps %xmm7,0x50(%esp)
- DB 15,41,100,36,64 ; movaps %xmm4,0x40(%esp)
- DB 15,41,116,36,48 ; movaps %xmm6,0x30(%esp)
- DB 15,41,108,36,32 ; movaps %xmm5,0x20(%esp)
- DB 137,124,36,16 ; mov %edi,0x10(%esp)
- DB 137,116,36,12 ; mov %esi,0xc(%esp)
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
- DB 255,82,4 ; call *0x4(%edx)
- DB 131,196,108 ; add $0x6c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 15,88,221 ; addps %xmm5,%xmm3
+ DB 141,72,8 ; lea 0x8(%eax),%ecx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 81 ; push %ecx
+ DB 255,117,8 ; pushl 0x8(%ebp)
+ DB 255,80,4 ; call *0x4(%eax)
+ DB 131,196,24 ; add $0x18,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -46294,15 +44251,12 @@ PUBLIC _sk_xy_to_unit_angle_sse2
_sk_xy_to_unit_angle_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 131,236,124 ; sub $0x7c,%esp
- DB 15,41,93,216 ; movaps %xmm3,-0x28(%ebp)
+ DB 131,236,24 ; sub $0x18,%esp
+ DB 15,41,93,232 ; movaps %xmm3,-0x18(%ebp)
DB 15,40,218 ; movaps %xmm2,%xmm3
DB 15,40,209 ; movaps %xmm1,%xmm2
DB 15,40,200 ; movaps %xmm0,%xmm1
- DB 232,0,0,0,0 ; call 8366 <_sk_xy_to_unit_angle_sse2+0x1b>
+ DB 232,0,0,0,0 ; call 6613 <_sk_xy_to_unit_angle_sse2+0x18>
DB 88 ; pop %eax
DB 15,87,237 ; xorps %xmm5,%xmm5
DB 15,92,233 ; subps %xmm1,%xmm5
@@ -46317,64 +44271,47 @@ _sk_xy_to_unit_angle_sse2 LABEL PROC
DB 15,94,247 ; divps %xmm7,%xmm6
DB 15,40,254 ; movaps %xmm6,%xmm7
DB 15,89,255 ; mulps %xmm7,%xmm7
- DB 15,40,128,138,31,0,0 ; movaps 0x1f8a(%eax),%xmm0
+ DB 15,40,128,253,25,0,0 ; movaps 0x19fd(%eax),%xmm0
DB 15,89,199 ; mulps %xmm7,%xmm0
- DB 15,88,128,154,31,0,0 ; addps 0x1f9a(%eax),%xmm0
+ DB 15,88,128,13,26,0,0 ; addps 0x1a0d(%eax),%xmm0
DB 15,89,199 ; mulps %xmm7,%xmm0
- DB 15,88,128,170,31,0,0 ; addps 0x1faa(%eax),%xmm0
+ DB 15,88,128,29,26,0,0 ; addps 0x1a1d(%eax),%xmm0
DB 15,89,199 ; mulps %xmm7,%xmm0
- DB 139,77,8 ; mov 0x8(%ebp),%ecx
- DB 139,85,16 ; mov 0x10(%ebp),%edx
- DB 139,117,20 ; mov 0x14(%ebp),%esi
- DB 139,125,24 ; mov 0x18(%ebp),%edi
- DB 15,88,128,186,31,0,0 ; addps 0x1fba(%eax),%xmm0
+ DB 15,88,128,45,26,0,0 ; addps 0x1a2d(%eax),%xmm0
DB 15,89,198 ; mulps %xmm6,%xmm0
- DB 15,40,117,40 ; movaps 0x28(%ebp),%xmm6
DB 15,194,236,1 ; cmpltps %xmm4,%xmm5
- DB 15,40,184,202,31,0,0 ; movaps 0x1fca(%eax),%xmm7
- DB 15,92,248 ; subps %xmm0,%xmm7
- DB 15,84,253 ; andps %xmm5,%xmm7
+ DB 15,40,176,61,26,0,0 ; movaps 0x1a3d(%eax),%xmm6
+ DB 15,92,240 ; subps %xmm0,%xmm6
+ DB 15,84,245 ; andps %xmm5,%xmm6
DB 15,85,232 ; andnps %xmm0,%xmm5
DB 15,87,228 ; xorps %xmm4,%xmm4
- DB 15,86,239 ; orps %xmm7,%xmm5
+ DB 15,86,238 ; orps %xmm6,%xmm5
DB 15,194,204,1 ; cmpltps %xmm4,%xmm1
- DB 15,40,128,218,31,0,0 ; movaps 0x1fda(%eax),%xmm0
+ DB 15,40,128,77,26,0,0 ; movaps 0x1a4d(%eax),%xmm0
DB 15,92,197 ; subps %xmm5,%xmm0
DB 15,84,193 ; andps %xmm1,%xmm0
DB 15,85,205 ; andnps %xmm5,%xmm1
DB 15,86,200 ; orps %xmm0,%xmm1
DB 15,40,194 ; movaps %xmm2,%xmm0
DB 15,194,196,1 ; cmpltps %xmm4,%xmm0
- DB 15,40,168,234,31,0,0 ; movaps 0x1fea(%eax),%xmm5
+ DB 15,40,168,93,26,0,0 ; movaps 0x1a5d(%eax),%xmm5
DB 15,92,233 ; subps %xmm1,%xmm5
DB 15,84,232 ; andps %xmm0,%xmm5
DB 15,85,193 ; andnps %xmm1,%xmm0
- DB 15,40,77,56 ; movaps 0x38(%ebp),%xmm1
DB 15,86,197 ; orps %xmm5,%xmm0
- DB 15,40,109,72 ; movaps 0x48(%ebp),%xmm5
DB 15,194,224,7 ; cmpordps %xmm0,%xmm4
DB 15,84,224 ; andps %xmm0,%xmm4
- DB 15,40,69,88 ; movaps 0x58(%ebp),%xmm0
DB 139,69,12 ; mov 0xc(%ebp),%eax
- DB 141,88,4 ; lea 0x4(%eax),%ebx
- DB 15,41,68,36,80 ; movaps %xmm0,0x50(%esp)
- DB 15,41,108,36,64 ; movaps %xmm5,0x40(%esp)
- DB 15,41,76,36,48 ; movaps %xmm1,0x30(%esp)
- DB 15,41,116,36,32 ; movaps %xmm6,0x20(%esp)
- DB 137,124,36,16 ; mov %edi,0x10(%esp)
- DB 137,116,36,12 ; mov %esi,0xc(%esp)
- DB 137,84,36,8 ; mov %edx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,12,36 ; mov %ecx,(%esp)
+ DB 141,72,4 ; lea 0x4(%eax),%ecx
+ DB 131,236,8 ; sub $0x8,%esp
DB 15,40,196 ; movaps %xmm4,%xmm0
DB 15,40,202 ; movaps %xmm2,%xmm1
DB 15,40,211 ; movaps %xmm3,%xmm2
- DB 15,40,93,216 ; movaps -0x28(%ebp),%xmm3
+ DB 15,40,93,232 ; movaps -0x18(%ebp),%xmm3
+ DB 81 ; push %ecx
+ DB 255,117,8 ; pushl 0x8(%ebp)
DB 255,16 ; call *(%eax)
- DB 131,196,124 ; add $0x7c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 131,196,40 ; add $0x28,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -46382,39 +44319,19 @@ PUBLIC _sk_xy_to_radius_sse2
_sk_xy_to_radius_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
- DB 139,85,20 ; mov 0x14(%ebp),%edx
- DB 139,117,24 ; mov 0x18(%ebp),%esi
- DB 15,40,109,56 ; movaps 0x38(%ebp),%xmm5
- DB 15,40,117,72 ; movaps 0x48(%ebp),%xmm6
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 15,89,192 ; mulps %xmm0,%xmm0
- DB 15,40,249 ; movaps %xmm1,%xmm7
- DB 15,89,255 ; mulps %xmm7,%xmm7
- DB 15,88,248 ; addps %xmm0,%xmm7
- DB 15,40,101,88 ; movaps 0x58(%ebp),%xmm4
- DB 139,125,12 ; mov 0xc(%ebp),%edi
- DB 15,81,199 ; sqrtps %xmm7,%xmm0
- DB 141,95,4 ; lea 0x4(%edi),%ebx
- DB 15,41,100,36,80 ; movaps %xmm4,0x50(%esp)
- DB 15,41,116,36,64 ; movaps %xmm6,0x40(%esp)
- DB 15,41,108,36,48 ; movaps %xmm5,0x30(%esp)
- DB 15,40,101,40 ; movaps 0x28(%ebp),%xmm4
- DB 15,41,100,36,32 ; movaps %xmm4,0x20(%esp)
- DB 137,116,36,16 ; mov %esi,0x10(%esp)
- DB 137,84,36,12 ; mov %edx,0xc(%esp)
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
- DB 255,23 ; call *(%edi)
- DB 131,196,108 ; add $0x6c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 15,40,225 ; movaps %xmm1,%xmm4
+ DB 15,89,228 ; mulps %xmm4,%xmm4
+ DB 15,88,224 ; addps %xmm0,%xmm4
+ DB 15,81,196 ; sqrtps %xmm4,%xmm0
+ DB 141,72,4 ; lea 0x4(%eax),%ecx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 81 ; push %ecx
+ DB 255,117,8 ; pushl 0x8(%ebp)
+ DB 255,16 ; call *(%eax)
+ DB 131,196,24 ; add $0x18,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -46422,74 +44339,48 @@ PUBLIC _sk_xy_to_2pt_conical_quadratic_max_sse2
_sk_xy_to_2pt_conical_quadratic_max_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 131,236,124 ; sub $0x7c,%esp
- DB 15,41,93,216 ; movaps %xmm3,-0x28(%ebp)
- DB 15,40,218 ; movaps %xmm2,%xmm3
- DB 15,40,209 ; movaps %xmm1,%xmm2
- DB 232,0,0,0,0 ; call 84eb <_sk_xy_to_2pt_conical_quadratic_max_sse2+0x18>
- DB 94 ; pop %esi
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
- DB 139,85,12 ; mov 0xc(%ebp),%edx
- DB 139,58 ; mov (%edx),%edi
- DB 243,15,16,111,32 ; movss 0x20(%edi),%xmm5
- DB 243,15,16,119,40 ; movss 0x28(%edi),%xmm6
- DB 243,15,16,103,44 ; movss 0x2c(%edi),%xmm4
- DB 243,15,89,230 ; mulss %xmm6,%xmm4
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 139,69,12 ; mov 0xc(%ebp),%eax
+ DB 139,8 ; mov (%eax),%ecx
+ DB 243,15,16,105,40 ; movss 0x28(%ecx),%xmm5
+ DB 243,15,16,97,44 ; movss 0x2c(%ecx),%xmm4
+ DB 243,15,89,229 ; mulss %xmm5,%xmm4
DB 15,198,228,0 ; shufps $0x0,%xmm4,%xmm4
DB 15,88,224 ; addps %xmm0,%xmm4
DB 15,89,192 ; mulps %xmm0,%xmm0
- DB 15,40,250 ; movaps %xmm2,%xmm7
- DB 15,89,255 ; mulps %xmm7,%xmm7
- DB 15,88,248 ; addps %xmm0,%xmm7
- DB 243,15,16,79,36 ; movss 0x24(%edi),%xmm1
- DB 139,125,20 ; mov 0x14(%ebp),%edi
+ DB 15,40,241 ; movaps %xmm1,%xmm6
+ DB 15,89,246 ; mulps %xmm6,%xmm6
+ DB 15,88,240 ; addps %xmm0,%xmm6
+ DB 232,0,0,0,0 ; call 6730 <_sk_xy_to_2pt_conical_quadratic_max_sse2+0x31>
+ DB 90 ; pop %edx
+ DB 243,15,89,237 ; mulss %xmm5,%xmm5
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
- DB 15,89,166,117,30,0,0 ; mulps 0x1e75(%esi),%xmm4
- DB 243,15,89,246 ; mulss %xmm6,%xmm6
- DB 15,198,246,0 ; shufps $0x0,%xmm6,%xmm6
- DB 15,92,254 ; subps %xmm6,%xmm7
- DB 15,89,174,133,30,0,0 ; mulps 0x1e85(%esi),%xmm5
- DB 15,89,239 ; mulps %xmm7,%xmm5
- DB 15,40,196 ; movaps %xmm4,%xmm0
- DB 15,89,192 ; mulps %xmm0,%xmm0
- DB 15,88,197 ; addps %xmm5,%xmm0
- DB 15,81,232 ; sqrtps %xmm0,%xmm5
- DB 15,198,201,0 ; shufps $0x0,%xmm1,%xmm1
+ DB 15,92,245 ; subps %xmm5,%xmm6
+ DB 243,15,16,65,32 ; movss 0x20(%ecx),%xmm0
+ DB 15,198,192,0 ; shufps $0x0,%xmm0,%xmm0
+ DB 15,89,162,80,25,0,0 ; mulps 0x1950(%edx),%xmm4
+ DB 15,89,130,96,25,0,0 ; mulps 0x1960(%edx),%xmm0
+ DB 15,89,198 ; mulps %xmm6,%xmm0
+ DB 15,40,236 ; movaps %xmm4,%xmm5
+ DB 15,89,237 ; mulps %xmm5,%xmm5
+ DB 15,88,232 ; addps %xmm0,%xmm5
+ DB 15,81,237 ; sqrtps %xmm5,%xmm5
DB 15,40,197 ; movaps %xmm5,%xmm0
DB 15,92,196 ; subps %xmm4,%xmm0
- DB 15,87,166,149,30,0,0 ; xorps 0x1e95(%esi),%xmm4
- DB 15,89,142,165,30,0,0 ; mulps 0x1ea5(%esi),%xmm1
- DB 139,117,24 ; mov 0x18(%ebp),%esi
- DB 15,40,117,40 ; movaps 0x28(%ebp),%xmm6
+ DB 15,87,162,112,25,0,0 ; xorps 0x1970(%edx),%xmm4
DB 15,92,229 ; subps %xmm5,%xmm4
- DB 15,40,109,56 ; movaps 0x38(%ebp),%xmm5
- DB 15,89,193 ; mulps %xmm1,%xmm0
- DB 15,89,225 ; mulps %xmm1,%xmm4
- DB 15,40,77,72 ; movaps 0x48(%ebp),%xmm1
+ DB 243,15,16,105,36 ; movss 0x24(%ecx),%xmm5
+ DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
+ DB 15,89,170,128,25,0,0 ; mulps 0x1980(%edx),%xmm5
+ DB 15,89,197 ; mulps %xmm5,%xmm0
+ DB 15,89,229 ; mulps %xmm5,%xmm4
DB 15,95,196 ; maxps %xmm4,%xmm0
- DB 15,40,101,88 ; movaps 0x58(%ebp),%xmm4
- DB 141,90,8 ; lea 0x8(%edx),%ebx
- DB 15,41,100,36,80 ; movaps %xmm4,0x50(%esp)
- DB 15,41,76,36,64 ; movaps %xmm1,0x40(%esp)
- DB 15,41,108,36,48 ; movaps %xmm5,0x30(%esp)
- DB 15,41,116,36,32 ; movaps %xmm6,0x20(%esp)
- DB 137,116,36,16 ; mov %esi,0x10(%esp)
- DB 137,124,36,12 ; mov %edi,0xc(%esp)
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
- DB 15,40,202 ; movaps %xmm2,%xmm1
- DB 15,40,211 ; movaps %xmm3,%xmm2
- DB 15,40,93,216 ; movaps -0x28(%ebp),%xmm3
- DB 255,82,4 ; call *0x4(%edx)
- DB 131,196,124 ; add $0x7c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 141,72,8 ; lea 0x8(%eax),%ecx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 81 ; push %ecx
+ DB 255,117,8 ; pushl 0x8(%ebp)
+ DB 255,80,4 ; call *0x4(%eax)
+ DB 131,196,24 ; add $0x18,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -46497,74 +44388,48 @@ PUBLIC _sk_xy_to_2pt_conical_quadratic_min_sse2
_sk_xy_to_2pt_conical_quadratic_min_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 131,236,124 ; sub $0x7c,%esp
- DB 15,41,93,216 ; movaps %xmm3,-0x28(%ebp)
- DB 15,40,218 ; movaps %xmm2,%xmm3
- DB 15,40,209 ; movaps %xmm1,%xmm2
- DB 232,0,0,0,0 ; call 85df <_sk_xy_to_2pt_conical_quadratic_min_sse2+0x18>
- DB 94 ; pop %esi
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
- DB 139,85,12 ; mov 0xc(%ebp),%edx
- DB 139,58 ; mov (%edx),%edi
- DB 243,15,16,111,32 ; movss 0x20(%edi),%xmm5
- DB 243,15,16,119,40 ; movss 0x28(%edi),%xmm6
- DB 243,15,16,103,44 ; movss 0x2c(%edi),%xmm4
- DB 243,15,89,230 ; mulss %xmm6,%xmm4
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 139,69,12 ; mov 0xc(%ebp),%eax
+ DB 139,8 ; mov (%eax),%ecx
+ DB 243,15,16,105,40 ; movss 0x28(%ecx),%xmm5
+ DB 243,15,16,97,44 ; movss 0x2c(%ecx),%xmm4
+ DB 243,15,89,229 ; mulss %xmm5,%xmm4
DB 15,198,228,0 ; shufps $0x0,%xmm4,%xmm4
DB 15,88,224 ; addps %xmm0,%xmm4
DB 15,89,192 ; mulps %xmm0,%xmm0
- DB 15,40,250 ; movaps %xmm2,%xmm7
- DB 15,89,255 ; mulps %xmm7,%xmm7
- DB 15,88,248 ; addps %xmm0,%xmm7
- DB 243,15,16,79,36 ; movss 0x24(%edi),%xmm1
- DB 139,125,20 ; mov 0x14(%ebp),%edi
+ DB 15,40,241 ; movaps %xmm1,%xmm6
+ DB 15,89,246 ; mulps %xmm6,%xmm6
+ DB 15,88,240 ; addps %xmm0,%xmm6
+ DB 232,0,0,0,0 ; call 67ce <_sk_xy_to_2pt_conical_quadratic_min_sse2+0x31>
+ DB 90 ; pop %edx
+ DB 243,15,89,237 ; mulss %xmm5,%xmm5
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
- DB 15,89,166,193,29,0,0 ; mulps 0x1dc1(%esi),%xmm4
- DB 243,15,89,246 ; mulss %xmm6,%xmm6
- DB 15,198,246,0 ; shufps $0x0,%xmm6,%xmm6
- DB 15,92,254 ; subps %xmm6,%xmm7
- DB 15,89,174,209,29,0,0 ; mulps 0x1dd1(%esi),%xmm5
- DB 15,89,239 ; mulps %xmm7,%xmm5
- DB 15,40,196 ; movaps %xmm4,%xmm0
- DB 15,89,192 ; mulps %xmm0,%xmm0
- DB 15,88,197 ; addps %xmm5,%xmm0
- DB 15,81,232 ; sqrtps %xmm0,%xmm5
- DB 15,198,201,0 ; shufps $0x0,%xmm1,%xmm1
+ DB 15,92,245 ; subps %xmm5,%xmm6
+ DB 243,15,16,65,32 ; movss 0x20(%ecx),%xmm0
+ DB 15,198,192,0 ; shufps $0x0,%xmm0,%xmm0
+ DB 15,89,162,242,24,0,0 ; mulps 0x18f2(%edx),%xmm4
+ DB 15,89,130,2,25,0,0 ; mulps 0x1902(%edx),%xmm0
+ DB 15,89,198 ; mulps %xmm6,%xmm0
+ DB 15,40,236 ; movaps %xmm4,%xmm5
+ DB 15,89,237 ; mulps %xmm5,%xmm5
+ DB 15,88,232 ; addps %xmm0,%xmm5
+ DB 15,81,237 ; sqrtps %xmm5,%xmm5
DB 15,40,197 ; movaps %xmm5,%xmm0
DB 15,92,196 ; subps %xmm4,%xmm0
- DB 15,87,166,225,29,0,0 ; xorps 0x1de1(%esi),%xmm4
- DB 15,89,142,241,29,0,0 ; mulps 0x1df1(%esi),%xmm1
- DB 139,117,24 ; mov 0x18(%ebp),%esi
- DB 15,40,117,40 ; movaps 0x28(%ebp),%xmm6
+ DB 15,87,162,18,25,0,0 ; xorps 0x1912(%edx),%xmm4
DB 15,92,229 ; subps %xmm5,%xmm4
- DB 15,40,109,56 ; movaps 0x38(%ebp),%xmm5
- DB 15,89,193 ; mulps %xmm1,%xmm0
- DB 15,89,225 ; mulps %xmm1,%xmm4
- DB 15,40,77,72 ; movaps 0x48(%ebp),%xmm1
+ DB 243,15,16,105,36 ; movss 0x24(%ecx),%xmm5
+ DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
+ DB 15,89,170,34,25,0,0 ; mulps 0x1922(%edx),%xmm5
+ DB 15,89,197 ; mulps %xmm5,%xmm0
+ DB 15,89,229 ; mulps %xmm5,%xmm4
DB 15,93,196 ; minps %xmm4,%xmm0
- DB 15,40,101,88 ; movaps 0x58(%ebp),%xmm4
- DB 141,90,8 ; lea 0x8(%edx),%ebx
- DB 15,41,100,36,80 ; movaps %xmm4,0x50(%esp)
- DB 15,41,76,36,64 ; movaps %xmm1,0x40(%esp)
- DB 15,41,108,36,48 ; movaps %xmm5,0x30(%esp)
- DB 15,41,116,36,32 ; movaps %xmm6,0x20(%esp)
- DB 137,116,36,16 ; mov %esi,0x10(%esp)
- DB 137,124,36,12 ; mov %edi,0xc(%esp)
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
- DB 15,40,202 ; movaps %xmm2,%xmm1
- DB 15,40,211 ; movaps %xmm3,%xmm2
- DB 15,40,93,216 ; movaps -0x28(%ebp),%xmm3
- DB 255,82,4 ; call *0x4(%edx)
- DB 131,196,124 ; add $0x7c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 141,72,8 ; lea 0x8(%eax),%ecx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 81 ; push %ecx
+ DB 255,117,8 ; pushl 0x8(%ebp)
+ DB 255,80,4 ; call *0x4(%eax)
+ DB 131,196,24 ; add $0x18,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -46572,23 +44437,17 @@ PUBLIC _sk_xy_to_2pt_conical_linear_sse2
_sk_xy_to_2pt_conical_linear_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 232,0,0,0,0 ; call 86c9 <_sk_xy_to_2pt_conical_linear_sse2+0xe>
- DB 94 ; pop %esi
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
- DB 139,85,12 ; mov 0xc(%ebp),%edx
- DB 139,58 ; mov (%edx),%edi
- DB 243,15,16,103,40 ; movss 0x28(%edi),%xmm4
- DB 243,15,16,111,44 ; movss 0x2c(%edi),%xmm5
- DB 139,125,20 ; mov 0x14(%ebp),%edi
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 232,0,0,0,0 ; call 6846 <_sk_xy_to_2pt_conical_linear_sse2+0xb>
+ DB 89 ; pop %ecx
+ DB 139,69,12 ; mov 0xc(%ebp),%eax
+ DB 139,16 ; mov (%eax),%edx
+ DB 243,15,16,98,40 ; movss 0x28(%edx),%xmm4
+ DB 243,15,16,106,44 ; movss 0x2c(%edx),%xmm5
DB 243,15,89,236 ; mulss %xmm4,%xmm5
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
DB 15,88,232 ; addps %xmm0,%xmm5
- DB 15,89,174,23,29,0,0 ; mulps 0x1d17(%esi),%xmm5
+ DB 15,89,169,186,24,0,0 ; mulps 0x18ba(%ecx),%xmm5
DB 15,89,192 ; mulps %xmm0,%xmm0
DB 15,40,241 ; movaps %xmm1,%xmm6
DB 15,89,246 ; mulps %xmm6,%xmm6
@@ -46596,28 +44455,14 @@ _sk_xy_to_2pt_conical_linear_sse2 LABEL PROC
DB 243,15,89,228 ; mulss %xmm4,%xmm4
DB 15,198,228,0 ; shufps $0x0,%xmm4,%xmm4
DB 15,92,196 ; subps %xmm4,%xmm0
- DB 15,87,134,39,29,0,0 ; xorps 0x1d27(%esi),%xmm0
- DB 139,117,24 ; mov 0x18(%ebp),%esi
- DB 15,40,101,40 ; movaps 0x28(%ebp),%xmm4
- DB 15,40,117,56 ; movaps 0x38(%ebp),%xmm6
- DB 15,40,125,72 ; movaps 0x48(%ebp),%xmm7
+ DB 15,87,129,202,24,0,0 ; xorps 0x18ca(%ecx),%xmm0
DB 15,94,197 ; divps %xmm5,%xmm0
- DB 15,40,109,88 ; movaps 0x58(%ebp),%xmm5
- DB 141,90,8 ; lea 0x8(%edx),%ebx
- DB 15,41,108,36,80 ; movaps %xmm5,0x50(%esp)
- DB 15,41,124,36,64 ; movaps %xmm7,0x40(%esp)
- DB 15,41,116,36,48 ; movaps %xmm6,0x30(%esp)
- DB 15,41,100,36,32 ; movaps %xmm4,0x20(%esp)
- DB 137,116,36,16 ; mov %esi,0x10(%esp)
- DB 137,124,36,12 ; mov %edi,0xc(%esp)
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
- DB 255,82,4 ; call *0x4(%edx)
- DB 131,196,108 ; add $0x6c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 141,72,8 ; lea 0x8(%eax),%ecx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 81 ; push %ecx
+ DB 255,117,8 ; pushl 0x8(%ebp)
+ DB 255,80,4 ; call *0x4(%eax)
+ DB 131,196,24 ; add $0x18,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -46625,17 +44470,12 @@ PUBLIC _sk_mask_2pt_conical_degenerates_sse2
_sk_mask_2pt_conical_degenerates_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
+ DB 131,236,8 ; sub $0x8,%esp
DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
- DB 139,117,20 ; mov 0x14(%ebp),%esi
- DB 139,85,12 ; mov 0xc(%ebp),%edx
- DB 139,58 ; mov (%edx),%edi
- DB 243,15,16,103,40 ; movss 0x28(%edi),%xmm4
- DB 243,15,16,111,44 ; movss 0x2c(%edi),%xmm5
+ DB 139,77,12 ; mov 0xc(%ebp),%ecx
+ DB 139,17 ; mov (%ecx),%edx
+ DB 243,15,16,98,40 ; movss 0x28(%edx),%xmm4
+ DB 243,15,16,106,44 ; movss 0x2c(%edx),%xmm5
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
DB 15,198,228,0 ; shufps $0x0,%xmm4,%xmm4
DB 15,89,232 ; mulps %xmm0,%xmm5
@@ -46645,27 +44485,13 @@ _sk_mask_2pt_conical_degenerates_sse2 LABEL PROC
DB 15,194,244,7 ; cmpordps %xmm4,%xmm6
DB 15,194,229,2 ; cmpleps %xmm5,%xmm4
DB 15,84,230 ; andps %xmm6,%xmm4
- DB 15,17,39 ; movups %xmm4,(%edi)
- DB 139,125,24 ; mov 0x18(%ebp),%edi
- DB 15,40,101,40 ; movaps 0x28(%ebp),%xmm4
- DB 15,40,109,56 ; movaps 0x38(%ebp),%xmm5
- DB 15,40,117,72 ; movaps 0x48(%ebp),%xmm6
- DB 15,40,125,88 ; movaps 0x58(%ebp),%xmm7
- DB 141,90,8 ; lea 0x8(%edx),%ebx
- DB 15,41,124,36,80 ; movaps %xmm7,0x50(%esp)
- DB 15,41,116,36,64 ; movaps %xmm6,0x40(%esp)
- DB 15,41,108,36,48 ; movaps %xmm5,0x30(%esp)
- DB 15,41,100,36,32 ; movaps %xmm4,0x20(%esp)
- DB 137,124,36,16 ; mov %edi,0x10(%esp)
- DB 137,116,36,12 ; mov %esi,0xc(%esp)
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
- DB 255,82,4 ; call *0x4(%edx)
- DB 131,196,108 ; add $0x6c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 15,17,34 ; movups %xmm4,(%edx)
+ DB 141,81,8 ; lea 0x8(%ecx),%edx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 82 ; push %edx
+ DB 80 ; push %eax
+ DB 255,81,4 ; call *0x4(%ecx)
+ DB 131,196,24 ; add $0x18,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -46673,40 +44499,20 @@ PUBLIC _sk_apply_vector_mask_sse2
_sk_apply_vector_mask_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
- DB 139,85,20 ; mov 0x14(%ebp),%edx
- DB 139,117,12 ; mov 0xc(%ebp),%esi
- DB 139,62 ; mov (%esi),%edi
- DB 15,16,39 ; movups (%edi),%xmm4
- DB 139,125,24 ; mov 0x18(%ebp),%edi
- DB 15,40,109,40 ; movaps 0x28(%ebp),%xmm5
- DB 15,40,117,56 ; movaps 0x38(%ebp),%xmm6
- DB 15,40,125,72 ; movaps 0x48(%ebp),%xmm7
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 139,69,12 ; mov 0xc(%ebp),%eax
+ DB 139,8 ; mov (%eax),%ecx
+ DB 15,16,33 ; movups (%ecx),%xmm4
DB 15,84,196 ; andps %xmm4,%xmm0
DB 15,84,204 ; andps %xmm4,%xmm1
DB 15,84,212 ; andps %xmm4,%xmm2
DB 15,84,220 ; andps %xmm4,%xmm3
- DB 15,40,101,88 ; movaps 0x58(%ebp),%xmm4
- DB 141,94,8 ; lea 0x8(%esi),%ebx
- DB 15,41,100,36,80 ; movaps %xmm4,0x50(%esp)
- DB 15,41,124,36,64 ; movaps %xmm7,0x40(%esp)
- DB 15,41,116,36,48 ; movaps %xmm6,0x30(%esp)
- DB 15,41,108,36,32 ; movaps %xmm5,0x20(%esp)
- DB 137,124,36,16 ; mov %edi,0x10(%esp)
- DB 137,84,36,12 ; mov %edx,0xc(%esp)
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
- DB 255,86,4 ; call *0x4(%esi)
- DB 131,196,108 ; add $0x6c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 141,72,8 ; lea 0x8(%eax),%ecx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 81 ; push %ecx
+ DB 255,117,8 ; pushl 0x8(%ebp)
+ DB 255,80,4 ; call *0x4(%eax)
+ DB 131,196,24 ; add $0x18,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -46714,22 +44520,19 @@ PUBLIC _sk_save_xy_sse2
_sk_save_xy_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 131,236,124 ; sub $0x7c,%esp
- DB 15,41,93,216 ; movaps %xmm3,-0x28(%ebp)
+ DB 131,236,24 ; sub $0x18,%esp
+ DB 15,41,93,232 ; movaps %xmm3,-0x18(%ebp)
DB 15,40,218 ; movaps %xmm2,%xmm3
- DB 232,0,0,0,0 ; call 886b <_sk_save_xy_sse2+0x15>
+ DB 232,0,0,0,0 ; call 6923 <_sk_save_xy_sse2+0x12>
DB 88 ; pop %eax
- DB 15,40,160,149,27,0,0 ; movaps 0x1b95(%eax),%xmm4
+ DB 15,40,160,253,23,0,0 ; movaps 0x17fd(%eax),%xmm4
DB 15,40,232 ; movaps %xmm0,%xmm5
DB 15,88,236 ; addps %xmm4,%xmm5
DB 243,15,91,245 ; cvttps2dq %xmm5,%xmm6
DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
DB 15,40,253 ; movaps %xmm5,%xmm7
DB 15,194,254,1 ; cmpltps %xmm6,%xmm7
- DB 15,40,144,165,27,0,0 ; movaps 0x1ba5(%eax),%xmm2
+ DB 15,40,144,13,24,0,0 ; movaps 0x180d(%eax),%xmm2
DB 15,84,250 ; andps %xmm2,%xmm7
DB 15,92,247 ; subps %xmm7,%xmm6
DB 15,92,238 ; subps %xmm6,%xmm5
@@ -46739,39 +44542,23 @@ _sk_save_xy_sse2 LABEL PROC
DB 15,40,252 ; movaps %xmm4,%xmm7
DB 15,194,254,1 ; cmpltps %xmm6,%xmm7
DB 15,84,250 ; andps %xmm2,%xmm7
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
- DB 139,85,20 ; mov 0x14(%ebp),%edx
- DB 139,117,12 ; mov 0xc(%ebp),%esi
- DB 139,62 ; mov (%esi),%edi
DB 15,92,247 ; subps %xmm7,%xmm6
DB 15,92,230 ; subps %xmm6,%xmm4
- DB 15,17,7 ; movups %xmm0,(%edi)
- DB 15,17,79,32 ; movups %xmm1,0x20(%edi)
- DB 15,17,111,64 ; movups %xmm5,0x40(%edi)
- DB 15,17,103,96 ; movups %xmm4,0x60(%edi)
- DB 139,125,24 ; mov 0x18(%ebp),%edi
- DB 15,40,85,40 ; movaps 0x28(%ebp),%xmm2
- DB 15,40,101,56 ; movaps 0x38(%ebp),%xmm4
- DB 15,40,109,72 ; movaps 0x48(%ebp),%xmm5
- DB 15,40,117,88 ; movaps 0x58(%ebp),%xmm6
- DB 141,94,8 ; lea 0x8(%esi),%ebx
- DB 15,41,116,36,80 ; movaps %xmm6,0x50(%esp)
- DB 15,41,108,36,64 ; movaps %xmm5,0x40(%esp)
- DB 15,41,100,36,48 ; movaps %xmm4,0x30(%esp)
- DB 15,41,84,36,32 ; movaps %xmm2,0x20(%esp)
- DB 137,124,36,16 ; mov %edi,0x10(%esp)
- DB 137,84,36,12 ; mov %edx,0xc(%esp)
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
+ DB 139,69,12 ; mov 0xc(%ebp),%eax
+ DB 139,8 ; mov (%eax),%ecx
+ DB 15,17,1 ; movups %xmm0,(%ecx)
+ DB 15,17,73,32 ; movups %xmm1,0x20(%ecx)
+ DB 15,17,105,64 ; movups %xmm5,0x40(%ecx)
+ DB 15,17,97,96 ; movups %xmm4,0x60(%ecx)
+ DB 139,77,8 ; mov 0x8(%ebp),%ecx
+ DB 141,80,8 ; lea 0x8(%eax),%edx
+ DB 131,236,8 ; sub $0x8,%esp
DB 15,40,211 ; movaps %xmm3,%xmm2
- DB 15,40,93,216 ; movaps -0x28(%ebp),%xmm3
- DB 255,86,4 ; call *0x4(%esi)
- DB 131,196,124 ; add $0x7c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 15,40,93,232 ; movaps -0x18(%ebp),%xmm3
+ DB 82 ; push %edx
+ DB 81 ; push %ecx
+ DB 255,80,4 ; call *0x4(%eax)
+ DB 131,196,40 ; add $0x28,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -46779,45 +44566,34 @@ PUBLIC _sk_accumulate_sse2
_sk_accumulate_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
- DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 139,77,8 ; mov 0x8(%ebp),%ecx
- DB 139,85,16 ; mov 0x10(%ebp),%edx
- DB 139,117,20 ; mov 0x14(%ebp),%esi
- DB 139,69,12 ; mov 0xc(%ebp),%eax
- DB 139,56 ; mov (%eax),%edi
- DB 15,16,167,128,0,0,0 ; movups 0x80(%edi),%xmm4
- DB 15,16,175,160,0,0,0 ; movups 0xa0(%edi),%xmm5
- DB 139,125,24 ; mov 0x18(%ebp),%edi
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 139,69,8 ; mov 0x8(%ebp),%eax
+ DB 139,77,12 ; mov 0xc(%ebp),%ecx
+ DB 139,17 ; mov (%ecx),%edx
+ DB 15,16,162,128,0,0,0 ; movups 0x80(%edx),%xmm4
+ DB 15,16,170,160,0,0,0 ; movups 0xa0(%edx),%xmm5
DB 15,89,236 ; mulps %xmm4,%xmm5
DB 15,40,229 ; movaps %xmm5,%xmm4
DB 15,89,224 ; mulps %xmm0,%xmm4
- DB 15,88,101,40 ; addps 0x28(%ebp),%xmm4
- DB 15,40,245 ; movaps %xmm5,%xmm6
- DB 15,89,241 ; mulps %xmm1,%xmm6
- DB 15,88,117,56 ; addps 0x38(%ebp),%xmm6
- DB 15,40,253 ; movaps %xmm5,%xmm7
- DB 15,89,250 ; mulps %xmm2,%xmm7
- DB 15,88,125,72 ; addps 0x48(%ebp),%xmm7
+ DB 15,88,96,16 ; addps 0x10(%eax),%xmm4
+ DB 15,41,96,16 ; movaps %xmm4,0x10(%eax)
+ DB 15,40,229 ; movaps %xmm5,%xmm4
+ DB 15,89,225 ; mulps %xmm1,%xmm4
+ DB 15,88,96,32 ; addps 0x20(%eax),%xmm4
+ DB 15,41,96,32 ; movaps %xmm4,0x20(%eax)
+ DB 15,40,229 ; movaps %xmm5,%xmm4
+ DB 15,89,226 ; mulps %xmm2,%xmm4
+ DB 15,88,96,48 ; addps 0x30(%eax),%xmm4
+ DB 15,41,96,48 ; movaps %xmm4,0x30(%eax)
DB 15,89,235 ; mulps %xmm3,%xmm5
- DB 15,88,109,88 ; addps 0x58(%ebp),%xmm5
- DB 141,88,8 ; lea 0x8(%eax),%ebx
- DB 137,124,36,16 ; mov %edi,0x10(%esp)
- DB 137,116,36,12 ; mov %esi,0xc(%esp)
- DB 137,84,36,8 ; mov %edx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,12,36 ; mov %ecx,(%esp)
- DB 15,41,108,36,80 ; movaps %xmm5,0x50(%esp)
- DB 15,41,124,36,64 ; movaps %xmm7,0x40(%esp)
- DB 15,41,116,36,48 ; movaps %xmm6,0x30(%esp)
- DB 15,41,100,36,32 ; movaps %xmm4,0x20(%esp)
- DB 255,80,4 ; call *0x4(%eax)
- DB 131,196,108 ; add $0x6c,%esp
- DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
+ DB 15,88,104,64 ; addps 0x40(%eax),%xmm5
+ DB 15,41,104,64 ; movaps %xmm5,0x40(%eax)
+ DB 141,81,8 ; lea 0x8(%ecx),%edx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 82 ; push %edx
+ DB 80 ; push %eax
+ DB 255,81,4 ; call *0x4(%ecx)
+ DB 131,196,24 ; add $0x18,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -46825,43 +44601,26 @@ PUBLIC _sk_bilinear_nx_sse2
_sk_bilinear_nx_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 232,0,0,0,0 ; call 89b0 <_sk_bilinear_nx_sse2+0xe>
+ DB 80 ; push %eax
+ DB 232,0,0,0,0 ; call 6a05 <_sk_bilinear_nx_sse2+0xa>
DB 88 ; pop %eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
- DB 139,85,16 ; mov 0x10(%ebp),%edx
- DB 139,117,12 ; mov 0xc(%ebp),%esi
- DB 139,62 ; mov (%esi),%edi
- DB 15,16,7 ; movups (%edi),%xmm0
- DB 15,88,128,112,26,0,0 ; addps 0x1a70(%eax),%xmm0
- DB 15,40,160,128,26,0,0 ; movaps 0x1a80(%eax),%xmm4
- DB 139,69,20 ; mov 0x14(%ebp),%eax
- DB 15,16,111,64 ; movups 0x40(%edi),%xmm5
- DB 15,92,229 ; subps %xmm5,%xmm4
- DB 15,17,167,128,0,0,0 ; movups %xmm4,0x80(%edi)
- DB 139,125,24 ; mov 0x18(%ebp),%edi
- DB 15,40,101,40 ; movaps 0x28(%ebp),%xmm4
- DB 15,40,109,56 ; movaps 0x38(%ebp),%xmm5
- DB 15,40,117,72 ; movaps 0x48(%ebp),%xmm6
- DB 15,40,125,88 ; movaps 0x58(%ebp),%xmm7
- DB 141,94,8 ; lea 0x8(%esi),%ebx
- DB 15,41,124,36,80 ; movaps %xmm7,0x50(%esp)
- DB 15,41,116,36,64 ; movaps %xmm6,0x40(%esp)
- DB 15,41,108,36,48 ; movaps %xmm5,0x30(%esp)
- DB 15,41,100,36,32 ; movaps %xmm4,0x20(%esp)
- DB 137,124,36,16 ; mov %edi,0x10(%esp)
- DB 137,68,36,12 ; mov %eax,0xc(%esp)
- DB 137,84,36,8 ; mov %edx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,12,36 ; mov %ecx,(%esp)
- DB 255,86,4 ; call *0x4(%esi)
- DB 131,196,108 ; add $0x6c,%esp
+ DB 139,85,12 ; mov 0xc(%ebp),%edx
+ DB 139,50 ; mov (%edx),%esi
+ DB 15,16,6 ; movups (%esi),%xmm0
+ DB 15,16,102,64 ; movups 0x40(%esi),%xmm4
+ DB 15,88,128,59,23,0,0 ; addps 0x173b(%eax),%xmm0
+ DB 15,40,168,75,23,0,0 ; movaps 0x174b(%eax),%xmm5
+ DB 15,92,236 ; subps %xmm4,%xmm5
+ DB 15,17,174,128,0,0,0 ; movups %xmm5,0x80(%esi)
+ DB 141,66,8 ; lea 0x8(%edx),%eax
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 80 ; push %eax
+ DB 81 ; push %ecx
+ DB 255,82,4 ; call *0x4(%edx)
+ DB 131,196,20 ; add $0x14,%esp
DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
DB 93 ; pop %ebp
DB 195 ; ret
@@ -46869,41 +44628,24 @@ PUBLIC _sk_bilinear_px_sse2
_sk_bilinear_px_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 232,0,0,0,0 ; call 8a34 <_sk_bilinear_px_sse2+0xe>
+ DB 80 ; push %eax
+ DB 232,0,0,0,0 ; call 6a48 <_sk_bilinear_px_sse2+0xa>
DB 88 ; pop %eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
- DB 139,85,16 ; mov 0x10(%ebp),%edx
- DB 139,117,12 ; mov 0xc(%ebp),%esi
- DB 139,62 ; mov (%esi),%edi
- DB 15,16,7 ; movups (%edi),%xmm0
- DB 15,88,128,12,26,0,0 ; addps 0x1a0c(%eax),%xmm0
- DB 139,69,20 ; mov 0x14(%ebp),%eax
- DB 15,16,103,64 ; movups 0x40(%edi),%xmm4
- DB 15,17,167,128,0,0,0 ; movups %xmm4,0x80(%edi)
- DB 139,125,24 ; mov 0x18(%ebp),%edi
- DB 15,40,101,40 ; movaps 0x28(%ebp),%xmm4
- DB 15,40,109,56 ; movaps 0x38(%ebp),%xmm5
- DB 15,40,117,72 ; movaps 0x48(%ebp),%xmm6
- DB 15,40,125,88 ; movaps 0x58(%ebp),%xmm7
- DB 141,94,8 ; lea 0x8(%esi),%ebx
- DB 15,41,124,36,80 ; movaps %xmm7,0x50(%esp)
- DB 15,41,116,36,64 ; movaps %xmm6,0x40(%esp)
- DB 15,41,108,36,48 ; movaps %xmm5,0x30(%esp)
- DB 15,41,100,36,32 ; movaps %xmm4,0x20(%esp)
- DB 137,124,36,16 ; mov %edi,0x10(%esp)
- DB 137,68,36,12 ; mov %eax,0xc(%esp)
- DB 137,84,36,8 ; mov %edx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,12,36 ; mov %ecx,(%esp)
- DB 255,86,4 ; call *0x4(%esi)
- DB 131,196,108 ; add $0x6c,%esp
+ DB 139,85,12 ; mov 0xc(%ebp),%edx
+ DB 139,50 ; mov (%edx),%esi
+ DB 15,16,6 ; movups (%esi),%xmm0
+ DB 15,16,102,64 ; movups 0x40(%esi),%xmm4
+ DB 15,88,128,24,23,0,0 ; addps 0x1718(%eax),%xmm0
+ DB 15,17,166,128,0,0,0 ; movups %xmm4,0x80(%esi)
+ DB 141,66,8 ; lea 0x8(%edx),%eax
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 80 ; push %eax
+ DB 81 ; push %ecx
+ DB 255,82,4 ; call *0x4(%edx)
+ DB 131,196,20 ; add $0x14,%esp
DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
DB 93 ; pop %ebp
DB 195 ; ret
@@ -46911,43 +44653,26 @@ PUBLIC _sk_bilinear_ny_sse2
_sk_bilinear_ny_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 232,0,0,0,0 ; call 8aae <_sk_bilinear_ny_sse2+0xe>
+ DB 80 ; push %eax
+ DB 232,0,0,0,0 ; call 6a81 <_sk_bilinear_ny_sse2+0xa>
DB 88 ; pop %eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
- DB 139,85,16 ; mov 0x10(%ebp),%edx
- DB 139,117,12 ; mov 0xc(%ebp),%esi
- DB 139,62 ; mov (%esi),%edi
- DB 15,16,79,32 ; movups 0x20(%edi),%xmm1
- DB 15,88,136,162,25,0,0 ; addps 0x19a2(%eax),%xmm1
- DB 15,40,160,178,25,0,0 ; movaps 0x19b2(%eax),%xmm4
- DB 139,69,20 ; mov 0x14(%ebp),%eax
- DB 15,16,111,96 ; movups 0x60(%edi),%xmm5
- DB 15,92,229 ; subps %xmm5,%xmm4
- DB 15,17,167,160,0,0,0 ; movups %xmm4,0xa0(%edi)
- DB 139,125,24 ; mov 0x18(%ebp),%edi
- DB 15,40,101,40 ; movaps 0x28(%ebp),%xmm4
- DB 15,40,109,56 ; movaps 0x38(%ebp),%xmm5
- DB 15,40,117,72 ; movaps 0x48(%ebp),%xmm6
- DB 15,40,125,88 ; movaps 0x58(%ebp),%xmm7
- DB 141,94,8 ; lea 0x8(%esi),%ebx
- DB 15,41,124,36,80 ; movaps %xmm7,0x50(%esp)
- DB 15,41,116,36,64 ; movaps %xmm6,0x40(%esp)
- DB 15,41,108,36,48 ; movaps %xmm5,0x30(%esp)
- DB 15,41,100,36,32 ; movaps %xmm4,0x20(%esp)
- DB 137,124,36,16 ; mov %edi,0x10(%esp)
- DB 137,68,36,12 ; mov %eax,0xc(%esp)
- DB 137,84,36,8 ; mov %edx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,12,36 ; mov %ecx,(%esp)
- DB 255,86,4 ; call *0x4(%esi)
- DB 131,196,108 ; add $0x6c,%esp
+ DB 139,85,12 ; mov 0xc(%ebp),%edx
+ DB 139,50 ; mov (%edx),%esi
+ DB 15,16,78,32 ; movups 0x20(%esi),%xmm1
+ DB 15,16,102,96 ; movups 0x60(%esi),%xmm4
+ DB 15,88,136,239,22,0,0 ; addps 0x16ef(%eax),%xmm1
+ DB 15,40,168,255,22,0,0 ; movaps 0x16ff(%eax),%xmm5
+ DB 15,92,236 ; subps %xmm4,%xmm5
+ DB 15,17,174,160,0,0,0 ; movups %xmm5,0xa0(%esi)
+ DB 141,66,8 ; lea 0x8(%edx),%eax
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 80 ; push %eax
+ DB 81 ; push %ecx
+ DB 255,82,4 ; call *0x4(%edx)
+ DB 131,196,20 ; add $0x14,%esp
DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
DB 93 ; pop %ebp
DB 195 ; ret
@@ -46955,41 +44680,24 @@ PUBLIC _sk_bilinear_py_sse2
_sk_bilinear_py_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 232,0,0,0,0 ; call 8b33 <_sk_bilinear_py_sse2+0xe>
+ DB 80 ; push %eax
+ DB 232,0,0,0,0 ; call 6ac5 <_sk_bilinear_py_sse2+0xa>
DB 88 ; pop %eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
- DB 139,85,16 ; mov 0x10(%ebp),%edx
- DB 139,117,12 ; mov 0xc(%ebp),%esi
- DB 139,62 ; mov (%esi),%edi
- DB 15,16,79,32 ; movups 0x20(%edi),%xmm1
- DB 15,88,136,61,25,0,0 ; addps 0x193d(%eax),%xmm1
- DB 139,69,20 ; mov 0x14(%ebp),%eax
- DB 15,16,103,96 ; movups 0x60(%edi),%xmm4
- DB 15,17,167,160,0,0,0 ; movups %xmm4,0xa0(%edi)
- DB 139,125,24 ; mov 0x18(%ebp),%edi
- DB 15,40,101,40 ; movaps 0x28(%ebp),%xmm4
- DB 15,40,109,56 ; movaps 0x38(%ebp),%xmm5
- DB 15,40,117,72 ; movaps 0x48(%ebp),%xmm6
- DB 15,40,125,88 ; movaps 0x58(%ebp),%xmm7
- DB 141,94,8 ; lea 0x8(%esi),%ebx
- DB 15,41,124,36,80 ; movaps %xmm7,0x50(%esp)
- DB 15,41,116,36,64 ; movaps %xmm6,0x40(%esp)
- DB 15,41,108,36,48 ; movaps %xmm5,0x30(%esp)
- DB 15,41,100,36,32 ; movaps %xmm4,0x20(%esp)
- DB 137,124,36,16 ; mov %edi,0x10(%esp)
- DB 137,68,36,12 ; mov %eax,0xc(%esp)
- DB 137,84,36,8 ; mov %edx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,12,36 ; mov %ecx,(%esp)
- DB 255,86,4 ; call *0x4(%esi)
- DB 131,196,108 ; add $0x6c,%esp
+ DB 139,85,12 ; mov 0xc(%ebp),%edx
+ DB 139,50 ; mov (%edx),%esi
+ DB 15,16,78,32 ; movups 0x20(%esi),%xmm1
+ DB 15,16,102,96 ; movups 0x60(%esi),%xmm4
+ DB 15,88,136,203,22,0,0 ; addps 0x16cb(%eax),%xmm1
+ DB 15,17,166,160,0,0,0 ; movups %xmm4,0xa0(%esi)
+ DB 141,66,8 ; lea 0x8(%edx),%eax
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 80 ; push %eax
+ DB 81 ; push %ecx
+ DB 255,82,4 ; call *0x4(%edx)
+ DB 131,196,20 ; add $0x14,%esp
DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
DB 93 ; pop %ebp
DB 195 ; ret
@@ -46997,48 +44705,31 @@ PUBLIC _sk_bicubic_n3x_sse2
_sk_bicubic_n3x_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 232,0,0,0,0 ; call 8bae <_sk_bicubic_n3x_sse2+0xe>
- DB 94 ; pop %esi
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
+ DB 80 ; push %eax
+ DB 232,0,0,0,0 ; call 6aff <_sk_bicubic_n3x_sse2+0xa>
+ DB 88 ; pop %eax
+ DB 139,77,8 ; mov 0x8(%ebp),%ecx
DB 139,85,12 ; mov 0xc(%ebp),%edx
- DB 139,58 ; mov (%edx),%edi
- DB 15,16,7 ; movups (%edi),%xmm0
- DB 15,16,103,64 ; movups 0x40(%edi),%xmm4
- DB 15,88,134,210,24,0,0 ; addps 0x18d2(%esi),%xmm0
- DB 15,40,174,226,24,0,0 ; movaps 0x18e2(%esi),%xmm5
+ DB 139,50 ; mov (%edx),%esi
+ DB 15,16,6 ; movups (%esi),%xmm0
+ DB 15,16,102,64 ; movups 0x40(%esi),%xmm4
+ DB 15,88,128,161,22,0,0 ; addps 0x16a1(%eax),%xmm0
+ DB 15,40,168,177,22,0,0 ; movaps 0x16b1(%eax),%xmm5
DB 15,92,236 ; subps %xmm4,%xmm5
DB 15,40,229 ; movaps %xmm5,%xmm4
- DB 15,89,174,242,24,0,0 ; mulps 0x18f2(%esi),%xmm5
- DB 15,88,174,2,25,0,0 ; addps 0x1902(%esi),%xmm5
- DB 139,117,20 ; mov 0x14(%ebp),%esi
DB 15,89,228 ; mulps %xmm4,%xmm4
+ DB 15,89,168,193,22,0,0 ; mulps 0x16c1(%eax),%xmm5
+ DB 15,88,168,209,22,0,0 ; addps 0x16d1(%eax),%xmm5
DB 15,89,236 ; mulps %xmm4,%xmm5
- DB 15,17,175,128,0,0,0 ; movups %xmm5,0x80(%edi)
- DB 139,125,24 ; mov 0x18(%ebp),%edi
- DB 15,40,101,40 ; movaps 0x28(%ebp),%xmm4
- DB 15,40,109,56 ; movaps 0x38(%ebp),%xmm5
- DB 15,40,117,72 ; movaps 0x48(%ebp),%xmm6
- DB 15,40,125,88 ; movaps 0x58(%ebp),%xmm7
- DB 141,90,8 ; lea 0x8(%edx),%ebx
- DB 15,41,124,36,80 ; movaps %xmm7,0x50(%esp)
- DB 15,41,116,36,64 ; movaps %xmm6,0x40(%esp)
- DB 15,41,108,36,48 ; movaps %xmm5,0x30(%esp)
- DB 15,41,100,36,32 ; movaps %xmm4,0x20(%esp)
- DB 137,124,36,16 ; mov %edi,0x10(%esp)
- DB 137,116,36,12 ; mov %esi,0xc(%esp)
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
+ DB 15,17,174,128,0,0,0 ; movups %xmm5,0x80(%esi)
+ DB 141,66,8 ; lea 0x8(%edx),%eax
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 80 ; push %eax
+ DB 81 ; push %ecx
DB 255,82,4 ; call *0x4(%edx)
- DB 131,196,108 ; add $0x6c,%esp
+ DB 131,196,20 ; add $0x14,%esp
DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
DB 93 ; pop %ebp
DB 195 ; ret
@@ -47046,50 +44737,33 @@ PUBLIC _sk_bicubic_n1x_sse2
_sk_bicubic_n1x_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 232,0,0,0,0 ; call 8c49 <_sk_bicubic_n1x_sse2+0xe>
- DB 94 ; pop %esi
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
+ DB 80 ; push %eax
+ DB 232,0,0,0,0 ; call 6b59 <_sk_bicubic_n1x_sse2+0xa>
+ DB 88 ; pop %eax
+ DB 139,77,8 ; mov 0x8(%ebp),%ecx
DB 139,85,12 ; mov 0xc(%ebp),%edx
- DB 139,58 ; mov (%edx),%edi
- DB 15,16,7 ; movups (%edi),%xmm0
- DB 15,16,103,64 ; movups 0x40(%edi),%xmm4
- DB 15,88,134,119,24,0,0 ; addps 0x1877(%esi),%xmm0
- DB 15,40,174,135,24,0,0 ; movaps 0x1887(%esi),%xmm5
+ DB 139,50 ; mov (%edx),%esi
+ DB 15,16,6 ; movups (%esi),%xmm0
+ DB 15,16,102,64 ; movups 0x40(%esi),%xmm4
+ DB 15,88,128,135,22,0,0 ; addps 0x1687(%eax),%xmm0
+ DB 15,40,168,151,22,0,0 ; movaps 0x1697(%eax),%xmm5
DB 15,92,236 ; subps %xmm4,%xmm5
- DB 15,40,166,151,24,0,0 ; movaps 0x1897(%esi),%xmm4
+ DB 15,40,160,167,22,0,0 ; movaps 0x16a7(%eax),%xmm4
DB 15,89,229 ; mulps %xmm5,%xmm4
- DB 15,88,166,167,24,0,0 ; addps 0x18a7(%esi),%xmm4
+ DB 15,88,160,183,22,0,0 ; addps 0x16b7(%eax),%xmm4
DB 15,89,229 ; mulps %xmm5,%xmm4
- DB 15,88,166,183,24,0,0 ; addps 0x18b7(%esi),%xmm4
+ DB 15,88,160,199,22,0,0 ; addps 0x16c7(%eax),%xmm4
DB 15,89,229 ; mulps %xmm5,%xmm4
- DB 15,88,166,199,24,0,0 ; addps 0x18c7(%esi),%xmm4
- DB 139,117,20 ; mov 0x14(%ebp),%esi
- DB 15,17,167,128,0,0,0 ; movups %xmm4,0x80(%edi)
- DB 139,125,24 ; mov 0x18(%ebp),%edi
- DB 15,40,101,40 ; movaps 0x28(%ebp),%xmm4
- DB 15,40,109,56 ; movaps 0x38(%ebp),%xmm5
- DB 15,40,117,72 ; movaps 0x48(%ebp),%xmm6
- DB 15,40,125,88 ; movaps 0x58(%ebp),%xmm7
- DB 141,90,8 ; lea 0x8(%edx),%ebx
- DB 15,41,124,36,80 ; movaps %xmm7,0x50(%esp)
- DB 15,41,116,36,64 ; movaps %xmm6,0x40(%esp)
- DB 15,41,108,36,48 ; movaps %xmm5,0x30(%esp)
- DB 15,41,100,36,32 ; movaps %xmm4,0x20(%esp)
- DB 137,124,36,16 ; mov %edi,0x10(%esp)
- DB 137,116,36,12 ; mov %esi,0xc(%esp)
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
+ DB 15,88,160,215,22,0,0 ; addps 0x16d7(%eax),%xmm4
+ DB 15,17,166,128,0,0,0 ; movups %xmm4,0x80(%esi)
+ DB 141,66,8 ; lea 0x8(%edx),%eax
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 80 ; push %eax
+ DB 81 ; push %ecx
DB 255,82,4 ; call *0x4(%edx)
- DB 131,196,108 ; add $0x6c,%esp
+ DB 131,196,20 ; add $0x14,%esp
DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
DB 93 ; pop %ebp
DB 195 ; ret
@@ -47097,49 +44771,32 @@ PUBLIC _sk_bicubic_p1x_sse2
_sk_bicubic_p1x_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 232,0,0,0,0 ; call 8cf2 <_sk_bicubic_p1x_sse2+0xe>
- DB 94 ; pop %esi
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
+ DB 80 ; push %eax
+ DB 232,0,0,0,0 ; call 6bc1 <_sk_bicubic_p1x_sse2+0xa>
+ DB 88 ; pop %eax
+ DB 139,77,8 ; mov 0x8(%ebp),%ecx
DB 139,85,12 ; mov 0xc(%ebp),%edx
- DB 139,58 ; mov (%edx),%edi
- DB 15,40,166,46,24,0,0 ; movaps 0x182e(%esi),%xmm4
- DB 15,16,71,64 ; movups 0x40(%edi),%xmm0
- DB 15,40,174,62,24,0,0 ; movaps 0x183e(%esi),%xmm5
- DB 15,89,232 ; mulps %xmm0,%xmm5
- DB 15,88,174,78,24,0,0 ; addps 0x184e(%esi),%xmm5
- DB 15,89,232 ; mulps %xmm0,%xmm5
- DB 15,88,236 ; addps %xmm4,%xmm5
- DB 15,89,232 ; mulps %xmm0,%xmm5
- DB 15,88,174,94,24,0,0 ; addps 0x185e(%esi),%xmm5
- DB 139,117,20 ; mov 0x14(%ebp),%esi
- DB 15,16,7 ; movups (%edi),%xmm0
- DB 15,17,175,128,0,0,0 ; movups %xmm5,0x80(%edi)
- DB 139,125,24 ; mov 0x18(%ebp),%edi
- DB 15,40,109,40 ; movaps 0x28(%ebp),%xmm5
- DB 15,40,117,56 ; movaps 0x38(%ebp),%xmm6
- DB 15,40,125,72 ; movaps 0x48(%ebp),%xmm7
+ DB 139,50 ; mov (%edx),%esi
+ DB 15,40,160,127,22,0,0 ; movaps 0x167f(%eax),%xmm4
+ DB 15,16,6 ; movups (%esi),%xmm0
+ DB 15,16,110,64 ; movups 0x40(%esi),%xmm5
DB 15,88,196 ; addps %xmm4,%xmm0
- DB 15,40,101,88 ; movaps 0x58(%ebp),%xmm4
- DB 141,90,8 ; lea 0x8(%edx),%ebx
- DB 15,41,100,36,80 ; movaps %xmm4,0x50(%esp)
- DB 15,41,124,36,64 ; movaps %xmm7,0x40(%esp)
- DB 15,41,116,36,48 ; movaps %xmm6,0x30(%esp)
- DB 15,41,108,36,32 ; movaps %xmm5,0x20(%esp)
- DB 137,124,36,16 ; mov %edi,0x10(%esp)
- DB 137,116,36,12 ; mov %esi,0xc(%esp)
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
+ DB 15,40,176,143,22,0,0 ; movaps 0x168f(%eax),%xmm6
+ DB 15,89,245 ; mulps %xmm5,%xmm6
+ DB 15,88,176,159,22,0,0 ; addps 0x169f(%eax),%xmm6
+ DB 15,89,245 ; mulps %xmm5,%xmm6
+ DB 15,88,244 ; addps %xmm4,%xmm6
+ DB 15,89,245 ; mulps %xmm5,%xmm6
+ DB 15,88,176,175,22,0,0 ; addps 0x16af(%eax),%xmm6
+ DB 15,17,182,128,0,0,0 ; movups %xmm6,0x80(%esi)
+ DB 141,66,8 ; lea 0x8(%edx),%eax
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 80 ; push %eax
+ DB 81 ; push %ecx
DB 255,82,4 ; call *0x4(%edx)
- DB 131,196,108 ; add $0x6c,%esp
+ DB 131,196,20 ; add $0x14,%esp
DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
DB 93 ; pop %ebp
DB 195 ; ret
@@ -47147,46 +44804,29 @@ PUBLIC _sk_bicubic_p3x_sse2
_sk_bicubic_p3x_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 232,0,0,0,0 ; call 8d90 <_sk_bicubic_p3x_sse2+0xe>
- DB 89 ; pop %ecx
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,85,16 ; mov 0x10(%ebp),%edx
- DB 139,117,12 ; mov 0xc(%ebp),%esi
- DB 139,62 ; mov (%esi),%edi
- DB 15,16,7 ; movups (%edi),%xmm0
- DB 15,16,103,64 ; movups 0x40(%edi),%xmm4
- DB 15,88,129,208,23,0,0 ; addps 0x17d0(%ecx),%xmm0
+ DB 80 ; push %eax
+ DB 232,0,0,0,0 ; call 6c1e <_sk_bicubic_p3x_sse2+0xa>
+ DB 88 ; pop %eax
+ DB 139,77,8 ; mov 0x8(%ebp),%ecx
+ DB 139,85,12 ; mov 0xc(%ebp),%edx
+ DB 139,50 ; mov (%edx),%esi
+ DB 15,16,6 ; movups (%esi),%xmm0
+ DB 15,16,102,64 ; movups 0x40(%esi),%xmm4
+ DB 15,88,128,98,22,0,0 ; addps 0x1662(%eax),%xmm0
DB 15,40,236 ; movaps %xmm4,%xmm5
- DB 15,89,161,224,23,0,0 ; mulps 0x17e0(%ecx),%xmm4
- DB 15,88,161,240,23,0,0 ; addps 0x17f0(%ecx),%xmm4
- DB 139,77,20 ; mov 0x14(%ebp),%ecx
DB 15,89,237 ; mulps %xmm5,%xmm5
+ DB 15,89,160,114,22,0,0 ; mulps 0x1672(%eax),%xmm4
+ DB 15,88,160,130,22,0,0 ; addps 0x1682(%eax),%xmm4
DB 15,89,229 ; mulps %xmm5,%xmm4
- DB 15,17,167,128,0,0,0 ; movups %xmm4,0x80(%edi)
- DB 139,125,24 ; mov 0x18(%ebp),%edi
- DB 15,40,101,40 ; movaps 0x28(%ebp),%xmm4
- DB 15,40,109,56 ; movaps 0x38(%ebp),%xmm5
- DB 15,40,117,72 ; movaps 0x48(%ebp),%xmm6
- DB 15,40,125,88 ; movaps 0x58(%ebp),%xmm7
- DB 141,94,8 ; lea 0x8(%esi),%ebx
- DB 15,41,124,36,80 ; movaps %xmm7,0x50(%esp)
- DB 15,41,116,36,64 ; movaps %xmm6,0x40(%esp)
- DB 15,41,108,36,48 ; movaps %xmm5,0x30(%esp)
- DB 15,41,100,36,32 ; movaps %xmm4,0x20(%esp)
- DB 137,124,36,16 ; mov %edi,0x10(%esp)
- DB 137,76,36,12 ; mov %ecx,0xc(%esp)
- DB 137,84,36,8 ; mov %edx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
- DB 255,86,4 ; call *0x4(%esi)
- DB 131,196,108 ; add $0x6c,%esp
+ DB 15,17,166,128,0,0,0 ; movups %xmm4,0x80(%esi)
+ DB 141,66,8 ; lea 0x8(%edx),%eax
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 80 ; push %eax
+ DB 81 ; push %ecx
+ DB 255,82,4 ; call *0x4(%edx)
+ DB 131,196,20 ; add $0x14,%esp
DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
DB 93 ; pop %ebp
DB 195 ; ret
@@ -47194,48 +44834,31 @@ PUBLIC _sk_bicubic_n3y_sse2
_sk_bicubic_n3y_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 232,0,0,0,0 ; call 8e21 <_sk_bicubic_n3y_sse2+0xe>
- DB 94 ; pop %esi
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
+ DB 80 ; push %eax
+ DB 232,0,0,0,0 ; call 6c6e <_sk_bicubic_n3y_sse2+0xa>
+ DB 88 ; pop %eax
+ DB 139,77,8 ; mov 0x8(%ebp),%ecx
DB 139,85,12 ; mov 0xc(%ebp),%edx
- DB 139,58 ; mov (%edx),%edi
- DB 15,16,79,32 ; movups 0x20(%edi),%xmm1
- DB 15,16,103,96 ; movups 0x60(%edi),%xmm4
- DB 15,88,142,111,23,0,0 ; addps 0x176f(%esi),%xmm1
- DB 15,40,174,127,23,0,0 ; movaps 0x177f(%esi),%xmm5
+ DB 139,50 ; mov (%edx),%esi
+ DB 15,16,78,32 ; movups 0x20(%esi),%xmm1
+ DB 15,16,102,96 ; movups 0x60(%esi),%xmm4
+ DB 15,88,136,66,22,0,0 ; addps 0x1642(%eax),%xmm1
+ DB 15,40,168,82,22,0,0 ; movaps 0x1652(%eax),%xmm5
DB 15,92,236 ; subps %xmm4,%xmm5
DB 15,40,229 ; movaps %xmm5,%xmm4
- DB 15,89,174,143,23,0,0 ; mulps 0x178f(%esi),%xmm5
- DB 15,88,174,159,23,0,0 ; addps 0x179f(%esi),%xmm5
- DB 139,117,20 ; mov 0x14(%ebp),%esi
DB 15,89,228 ; mulps %xmm4,%xmm4
+ DB 15,89,168,98,22,0,0 ; mulps 0x1662(%eax),%xmm5
+ DB 15,88,168,114,22,0,0 ; addps 0x1672(%eax),%xmm5
DB 15,89,236 ; mulps %xmm4,%xmm5
- DB 15,17,175,160,0,0,0 ; movups %xmm5,0xa0(%edi)
- DB 139,125,24 ; mov 0x18(%ebp),%edi
- DB 15,40,101,40 ; movaps 0x28(%ebp),%xmm4
- DB 15,40,109,56 ; movaps 0x38(%ebp),%xmm5
- DB 15,40,117,72 ; movaps 0x48(%ebp),%xmm6
- DB 15,40,125,88 ; movaps 0x58(%ebp),%xmm7
- DB 141,90,8 ; lea 0x8(%edx),%ebx
- DB 15,41,124,36,80 ; movaps %xmm7,0x50(%esp)
- DB 15,41,116,36,64 ; movaps %xmm6,0x40(%esp)
- DB 15,41,108,36,48 ; movaps %xmm5,0x30(%esp)
- DB 15,41,100,36,32 ; movaps %xmm4,0x20(%esp)
- DB 137,124,36,16 ; mov %edi,0x10(%esp)
- DB 137,116,36,12 ; mov %esi,0xc(%esp)
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
+ DB 15,17,174,160,0,0,0 ; movups %xmm5,0xa0(%esi)
+ DB 141,66,8 ; lea 0x8(%edx),%eax
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 80 ; push %eax
+ DB 81 ; push %ecx
DB 255,82,4 ; call *0x4(%edx)
- DB 131,196,108 ; add $0x6c,%esp
+ DB 131,196,20 ; add $0x14,%esp
DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
DB 93 ; pop %ebp
DB 195 ; ret
@@ -47243,50 +44866,33 @@ PUBLIC _sk_bicubic_n1y_sse2
_sk_bicubic_n1y_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 232,0,0,0,0 ; call 8ebd <_sk_bicubic_n1y_sse2+0xe>
- DB 94 ; pop %esi
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
+ DB 80 ; push %eax
+ DB 232,0,0,0,0 ; call 6cc9 <_sk_bicubic_n1y_sse2+0xa>
+ DB 88 ; pop %eax
+ DB 139,77,8 ; mov 0x8(%ebp),%ecx
DB 139,85,12 ; mov 0xc(%ebp),%edx
- DB 139,58 ; mov (%edx),%edi
- DB 15,16,79,32 ; movups 0x20(%edi),%xmm1
- DB 15,16,103,96 ; movups 0x60(%edi),%xmm4
- DB 15,88,142,19,23,0,0 ; addps 0x1713(%esi),%xmm1
- DB 15,40,174,35,23,0,0 ; movaps 0x1723(%esi),%xmm5
+ DB 139,50 ; mov (%edx),%esi
+ DB 15,16,78,32 ; movups 0x20(%esi),%xmm1
+ DB 15,16,102,96 ; movups 0x60(%esi),%xmm4
+ DB 15,88,136,39,22,0,0 ; addps 0x1627(%eax),%xmm1
+ DB 15,40,168,55,22,0,0 ; movaps 0x1637(%eax),%xmm5
DB 15,92,236 ; subps %xmm4,%xmm5
- DB 15,40,166,51,23,0,0 ; movaps 0x1733(%esi),%xmm4
+ DB 15,40,160,71,22,0,0 ; movaps 0x1647(%eax),%xmm4
DB 15,89,229 ; mulps %xmm5,%xmm4
- DB 15,88,166,67,23,0,0 ; addps 0x1743(%esi),%xmm4
+ DB 15,88,160,87,22,0,0 ; addps 0x1657(%eax),%xmm4
DB 15,89,229 ; mulps %xmm5,%xmm4
- DB 15,88,166,83,23,0,0 ; addps 0x1753(%esi),%xmm4
+ DB 15,88,160,103,22,0,0 ; addps 0x1667(%eax),%xmm4
DB 15,89,229 ; mulps %xmm5,%xmm4
- DB 15,88,166,99,23,0,0 ; addps 0x1763(%esi),%xmm4
- DB 139,117,20 ; mov 0x14(%ebp),%esi
- DB 15,17,167,160,0,0,0 ; movups %xmm4,0xa0(%edi)
- DB 139,125,24 ; mov 0x18(%ebp),%edi
- DB 15,40,101,40 ; movaps 0x28(%ebp),%xmm4
- DB 15,40,109,56 ; movaps 0x38(%ebp),%xmm5
- DB 15,40,117,72 ; movaps 0x48(%ebp),%xmm6
- DB 15,40,125,88 ; movaps 0x58(%ebp),%xmm7
- DB 141,90,8 ; lea 0x8(%edx),%ebx
- DB 15,41,124,36,80 ; movaps %xmm7,0x50(%esp)
- DB 15,41,116,36,64 ; movaps %xmm6,0x40(%esp)
- DB 15,41,108,36,48 ; movaps %xmm5,0x30(%esp)
- DB 15,41,100,36,32 ; movaps %xmm4,0x20(%esp)
- DB 137,124,36,16 ; mov %edi,0x10(%esp)
- DB 137,116,36,12 ; mov %esi,0xc(%esp)
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
+ DB 15,88,160,119,22,0,0 ; addps 0x1677(%eax),%xmm4
+ DB 15,17,166,160,0,0,0 ; movups %xmm4,0xa0(%esi)
+ DB 141,66,8 ; lea 0x8(%edx),%eax
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 80 ; push %eax
+ DB 81 ; push %ecx
DB 255,82,4 ; call *0x4(%edx)
- DB 131,196,108 ; add $0x6c,%esp
+ DB 131,196,20 ; add $0x14,%esp
DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
DB 93 ; pop %ebp
DB 195 ; ret
@@ -47294,49 +44900,32 @@ PUBLIC _sk_bicubic_p1y_sse2
_sk_bicubic_p1y_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 232,0,0,0,0 ; call 8f67 <_sk_bicubic_p1y_sse2+0xe>
- DB 94 ; pop %esi
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
+ DB 80 ; push %eax
+ DB 232,0,0,0,0 ; call 6d32 <_sk_bicubic_p1y_sse2+0xa>
+ DB 88 ; pop %eax
+ DB 139,77,8 ; mov 0x8(%ebp),%ecx
DB 139,85,12 ; mov 0xc(%ebp),%edx
- DB 139,58 ; mov (%edx),%edi
- DB 15,40,166,201,22,0,0 ; movaps 0x16c9(%esi),%xmm4
- DB 15,16,79,96 ; movups 0x60(%edi),%xmm1
- DB 15,40,174,217,22,0,0 ; movaps 0x16d9(%esi),%xmm5
- DB 15,89,233 ; mulps %xmm1,%xmm5
- DB 15,88,174,233,22,0,0 ; addps 0x16e9(%esi),%xmm5
- DB 15,89,233 ; mulps %xmm1,%xmm5
- DB 15,88,236 ; addps %xmm4,%xmm5
- DB 15,89,233 ; mulps %xmm1,%xmm5
- DB 15,88,174,249,22,0,0 ; addps 0x16f9(%esi),%xmm5
- DB 139,117,20 ; mov 0x14(%ebp),%esi
- DB 15,16,79,32 ; movups 0x20(%edi),%xmm1
- DB 15,17,175,160,0,0,0 ; movups %xmm5,0xa0(%edi)
- DB 139,125,24 ; mov 0x18(%ebp),%edi
- DB 15,40,109,40 ; movaps 0x28(%ebp),%xmm5
- DB 15,40,117,56 ; movaps 0x38(%ebp),%xmm6
- DB 15,40,125,72 ; movaps 0x48(%ebp),%xmm7
+ DB 139,50 ; mov (%edx),%esi
+ DB 15,40,160,30,22,0,0 ; movaps 0x161e(%eax),%xmm4
+ DB 15,16,78,32 ; movups 0x20(%esi),%xmm1
+ DB 15,16,110,96 ; movups 0x60(%esi),%xmm5
DB 15,88,204 ; addps %xmm4,%xmm1
- DB 15,40,101,88 ; movaps 0x58(%ebp),%xmm4
- DB 141,90,8 ; lea 0x8(%edx),%ebx
- DB 15,41,100,36,80 ; movaps %xmm4,0x50(%esp)
- DB 15,41,124,36,64 ; movaps %xmm7,0x40(%esp)
- DB 15,41,116,36,48 ; movaps %xmm6,0x30(%esp)
- DB 15,41,108,36,32 ; movaps %xmm5,0x20(%esp)
- DB 137,124,36,16 ; mov %edi,0x10(%esp)
- DB 137,116,36,12 ; mov %esi,0xc(%esp)
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
+ DB 15,40,176,46,22,0,0 ; movaps 0x162e(%eax),%xmm6
+ DB 15,89,245 ; mulps %xmm5,%xmm6
+ DB 15,88,176,62,22,0,0 ; addps 0x163e(%eax),%xmm6
+ DB 15,89,245 ; mulps %xmm5,%xmm6
+ DB 15,88,244 ; addps %xmm4,%xmm6
+ DB 15,89,245 ; mulps %xmm5,%xmm6
+ DB 15,88,176,78,22,0,0 ; addps 0x164e(%eax),%xmm6
+ DB 15,17,182,160,0,0,0 ; movups %xmm6,0xa0(%esi)
+ DB 141,66,8 ; lea 0x8(%edx),%eax
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 80 ; push %eax
+ DB 81 ; push %ecx
DB 255,82,4 ; call *0x4(%edx)
- DB 131,196,108 ; add $0x6c,%esp
+ DB 131,196,20 ; add $0x14,%esp
DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
DB 93 ; pop %ebp
DB 195 ; ret
@@ -47344,46 +44933,29 @@ PUBLIC _sk_bicubic_p3y_sse2
_sk_bicubic_p3y_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
- DB 83 ; push %ebx
- DB 87 ; push %edi
DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
- DB 232,0,0,0,0 ; call 9006 <_sk_bicubic_p3y_sse2+0xe>
- DB 89 ; pop %ecx
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 139,85,16 ; mov 0x10(%ebp),%edx
- DB 139,117,12 ; mov 0xc(%ebp),%esi
- DB 139,62 ; mov (%esi),%edi
- DB 15,16,79,32 ; movups 0x20(%edi),%xmm1
- DB 15,16,103,96 ; movups 0x60(%edi),%xmm4
- DB 15,88,137,106,22,0,0 ; addps 0x166a(%ecx),%xmm1
+ DB 80 ; push %eax
+ DB 232,0,0,0,0 ; call 6d90 <_sk_bicubic_p3y_sse2+0xa>
+ DB 88 ; pop %eax
+ DB 139,77,8 ; mov 0x8(%ebp),%ecx
+ DB 139,85,12 ; mov 0xc(%ebp),%edx
+ DB 139,50 ; mov (%edx),%esi
+ DB 15,16,78,32 ; movups 0x20(%esi),%xmm1
+ DB 15,16,102,96 ; movups 0x60(%esi),%xmm4
+ DB 15,88,136,0,22,0,0 ; addps 0x1600(%eax),%xmm1
DB 15,40,236 ; movaps %xmm4,%xmm5
- DB 15,89,161,122,22,0,0 ; mulps 0x167a(%ecx),%xmm4
- DB 15,88,161,138,22,0,0 ; addps 0x168a(%ecx),%xmm4
- DB 139,77,20 ; mov 0x14(%ebp),%ecx
DB 15,89,237 ; mulps %xmm5,%xmm5
+ DB 15,89,160,16,22,0,0 ; mulps 0x1610(%eax),%xmm4
+ DB 15,88,160,32,22,0,0 ; addps 0x1620(%eax),%xmm4
DB 15,89,229 ; mulps %xmm5,%xmm4
- DB 15,17,167,160,0,0,0 ; movups %xmm4,0xa0(%edi)
- DB 139,125,24 ; mov 0x18(%ebp),%edi
- DB 15,40,101,40 ; movaps 0x28(%ebp),%xmm4
- DB 15,40,109,56 ; movaps 0x38(%ebp),%xmm5
- DB 15,40,117,72 ; movaps 0x48(%ebp),%xmm6
- DB 15,40,125,88 ; movaps 0x58(%ebp),%xmm7
- DB 141,94,8 ; lea 0x8(%esi),%ebx
- DB 15,41,124,36,80 ; movaps %xmm7,0x50(%esp)
- DB 15,41,116,36,64 ; movaps %xmm6,0x40(%esp)
- DB 15,41,108,36,48 ; movaps %xmm5,0x30(%esp)
- DB 15,41,100,36,32 ; movaps %xmm4,0x20(%esp)
- DB 137,124,36,16 ; mov %edi,0x10(%esp)
- DB 137,76,36,12 ; mov %ecx,0xc(%esp)
- DB 137,84,36,8 ; mov %edx,0x8(%esp)
- DB 137,92,36,4 ; mov %ebx,0x4(%esp)
- DB 137,4,36 ; mov %eax,(%esp)
- DB 255,86,4 ; call *0x4(%esi)
- DB 131,196,108 ; add $0x6c,%esp
+ DB 15,17,166,160,0,0,0 ; movups %xmm4,0xa0(%esi)
+ DB 141,66,8 ; lea 0x8(%edx),%eax
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 80 ; push %eax
+ DB 81 ; push %ecx
+ DB 255,82,4 ; call *0x4(%edx)
+ DB 131,196,20 ; add $0x14,%esp
DB 94 ; pop %esi
- DB 95 ; pop %edi
- DB 91 ; pop %ebx
DB 93 ; pop %ebp
DB 195 ; ret
@@ -47394,33 +44966,36 @@ _sk_callback_sse2 LABEL PROC
DB 83 ; push %ebx
DB 87 ; push %edi
DB 86 ; push %esi
- DB 131,236,108 ; sub $0x6c,%esp
+ DB 131,236,12 ; sub $0xc,%esp
+ DB 139,117,12 ; mov 0xc(%ebp),%esi
+ DB 139,125,8 ; mov 0x8(%ebp),%edi
+ DB 139,71,8 ; mov 0x8(%edi),%eax
+ DB 139,30 ; mov (%esi),%ebx
DB 15,40,224 ; movaps %xmm0,%xmm4
DB 15,20,225 ; unpcklps %xmm1,%xmm4
+ DB 15,40,234 ; movaps %xmm2,%xmm5
+ DB 15,20,235 ; unpcklps %xmm3,%xmm5
DB 15,21,193 ; unpckhps %xmm1,%xmm0
- DB 15,40,202 ; movaps %xmm2,%xmm1
- DB 15,20,203 ; unpcklps %xmm3,%xmm1
DB 15,21,211 ; unpckhps %xmm3,%xmm2
- DB 15,40,220 ; movaps %xmm4,%xmm3
- DB 102,15,20,217 ; unpcklpd %xmm1,%xmm3
- DB 15,18,204 ; movhlps %xmm4,%xmm1
- DB 139,117,12 ; mov 0xc(%ebp),%esi
- DB 139,62 ; mov (%esi),%edi
- DB 102,15,17,95,4 ; movupd %xmm3,0x4(%edi)
+ DB 15,40,204 ; movaps %xmm4,%xmm1
+ DB 102,15,20,205 ; unpcklpd %xmm5,%xmm1
+ DB 15,18,236 ; movhlps %xmm4,%xmm5
DB 15,40,216 ; movaps %xmm0,%xmm3
DB 102,15,20,218 ; unpcklpd %xmm2,%xmm3
+ DB 102,15,17,75,4 ; movupd %xmm1,0x4(%ebx)
DB 15,18,208 ; movhlps %xmm0,%xmm2
- DB 15,17,79,20 ; movups %xmm1,0x14(%edi)
- DB 102,15,17,95,36 ; movupd %xmm3,0x24(%edi)
- DB 15,17,87,52 ; movups %xmm2,0x34(%edi)
- DB 139,93,24 ; mov 0x18(%ebp),%ebx
- DB 133,219 ; test %ebx,%ebx
- DB 184,4,0,0,0 ; mov $0x4,%eax
- DB 15,69,195 ; cmovne %ebx,%eax
- DB 137,68,36,4 ; mov %eax,0x4(%esp)
- DB 137,60,36 ; mov %edi,(%esp)
- DB 255,23 ; call *(%edi)
- DB 139,135,132,0,0,0 ; mov 0x84(%edi),%eax
+ DB 15,17,107,20 ; movups %xmm5,0x14(%ebx)
+ DB 102,15,17,91,36 ; movupd %xmm3,0x24(%ebx)
+ DB 15,17,83,52 ; movups %xmm2,0x34(%ebx)
+ DB 133,192 ; test %eax,%eax
+ DB 185,4,0,0,0 ; mov $0x4,%ecx
+ DB 15,69,200 ; cmovne %eax,%ecx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 81 ; push %ecx
+ DB 83 ; push %ebx
+ DB 255,19 ; call *(%ebx)
+ DB 131,196,16 ; add $0x10,%esp
+ DB 139,131,132,0,0,0 ; mov 0x84(%ebx),%eax
DB 15,16,32 ; movups (%eax),%xmm4
DB 15,16,64,16 ; movups 0x10(%eax),%xmm0
DB 15,16,88,32 ; movups 0x20(%eax),%xmm3
@@ -47438,24 +45013,11 @@ _sk_callback_sse2 LABEL PROC
DB 102,15,20,211 ; unpcklpd %xmm3,%xmm2
DB 15,18,220 ; movhlps %xmm4,%xmm3
DB 141,70,8 ; lea 0x8(%esi),%eax
- DB 15,40,101,88 ; movaps 0x58(%ebp),%xmm4
- DB 15,41,100,36,80 ; movaps %xmm4,0x50(%esp)
- DB 15,40,101,72 ; movaps 0x48(%ebp),%xmm4
- DB 15,41,100,36,64 ; movaps %xmm4,0x40(%esp)
- DB 15,40,101,56 ; movaps 0x38(%ebp),%xmm4
- DB 15,41,100,36,48 ; movaps %xmm4,0x30(%esp)
- DB 15,40,101,40 ; movaps 0x28(%ebp),%xmm4
- DB 15,41,100,36,32 ; movaps %xmm4,0x20(%esp)
- DB 137,92,36,16 ; mov %ebx,0x10(%esp)
- DB 139,77,20 ; mov 0x14(%ebp),%ecx
- DB 137,76,36,12 ; mov %ecx,0xc(%esp)
- DB 139,77,16 ; mov 0x10(%ebp),%ecx
- DB 137,76,36,8 ; mov %ecx,0x8(%esp)
- DB 137,68,36,4 ; mov %eax,0x4(%esp)
- DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 137,4,36 ; mov %eax,(%esp)
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 80 ; push %eax
+ DB 87 ; push %edi
DB 255,86,4 ; call *0x4(%esi)
- DB 131,196,108 ; add $0x6c,%esp
+ DB 131,196,28 ; add $0x1c,%esp
DB 94 ; pop %esi
DB 95 ; pop %edi
DB 91 ; pop %ebx
@@ -47619,9 +45181,9 @@ ALIGN 16
DB 0,224 ; add %ah,%al
DB 64 ; inc %eax
DB 0,0 ; add %al,(%eax)
- DB 224,64 ; loopne 936c <.literal16+0x1fc>
+ DB 224,64 ; loopne 708c <.literal16+0x1fc>
DB 0,0 ; add %al,(%eax)
- DB 224,64 ; loopne 9370 <.literal16+0x200>
+ DB 224,64 ; loopne 7090 <.literal16+0x200>
DB 154,153,153,62,154,153,153 ; lcall $0x9999,$0x9a3e9999
DB 62,154,153,153,62,154,153,153 ; ds lcall $0x9999,$0x9a3e9999
DB 62,61,10,23,63,61 ; ds cmp $0x3d3f170a,%eax
@@ -47632,16 +45194,16 @@ ALIGN 16
DB 63 ; aas
DB 174 ; scas %es:(%edi),%al
DB 71 ; inc %edi
- DB 225,61 ; loope 9391 <.literal16+0x221>
+ DB 225,61 ; loope 70b1 <.literal16+0x221>
DB 174 ; scas %es:(%edi),%al
DB 71 ; inc %edi
- DB 225,61 ; loope 9395 <.literal16+0x225>
+ DB 225,61 ; loope 70b5 <.literal16+0x225>
DB 174 ; scas %es:(%edi),%al
DB 71 ; inc %edi
- DB 225,61 ; loope 9399 <.literal16+0x229>
+ DB 225,61 ; loope 70b9 <.literal16+0x229>
DB 174 ; scas %es:(%edi),%al
DB 71 ; inc %edi
- DB 225,61 ; loope 939d <.literal16+0x22d>
+ DB 225,61 ; loope 70bd <.literal16+0x22d>
DB 0,0 ; add %al,(%eax)
DB 128,63,0 ; cmpb $0x0,(%edi)
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%eax)
@@ -47658,16 +45220,16 @@ ALIGN 16
DB 63 ; aas
DB 61,10,23,63,174 ; cmp $0xae3f170a,%eax
DB 71 ; inc %edi
- DB 225,61 ; loope 93d1 <.literal16+0x261>
+ DB 225,61 ; loope 70f1 <.literal16+0x261>
DB 174 ; scas %es:(%edi),%al
DB 71 ; inc %edi
- DB 225,61 ; loope 93d5 <.literal16+0x265>
+ DB 225,61 ; loope 70f5 <.literal16+0x265>
DB 174 ; scas %es:(%edi),%al
DB 71 ; inc %edi
- DB 225,61 ; loope 93d9 <.literal16+0x269>
+ DB 225,61 ; loope 70f9 <.literal16+0x269>
DB 174 ; scas %es:(%edi),%al
DB 71 ; inc %edi
- DB 225,61 ; loope 93dd <.literal16+0x26d>
+ DB 225,61 ; loope 70fd <.literal16+0x26d>
DB 0,0 ; add %al,(%eax)
DB 128,63,0 ; cmpb $0x0,(%edi)
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%eax)
@@ -47684,16 +45246,16 @@ ALIGN 16
DB 63 ; aas
DB 61,10,23,63,174 ; cmp $0xae3f170a,%eax
DB 71 ; inc %edi
- DB 225,61 ; loope 9411 <.literal16+0x2a1>
+ DB 225,61 ; loope 7131 <.literal16+0x2a1>
DB 174 ; scas %es:(%edi),%al
DB 71 ; inc %edi
- DB 225,61 ; loope 9415 <.literal16+0x2a5>
+ DB 225,61 ; loope 7135 <.literal16+0x2a5>
DB 174 ; scas %es:(%edi),%al
DB 71 ; inc %edi
- DB 225,61 ; loope 9419 <.literal16+0x2a9>
+ DB 225,61 ; loope 7139 <.literal16+0x2a9>
DB 174 ; scas %es:(%edi),%al
DB 71 ; inc %edi
- DB 225,61 ; loope 941d <.literal16+0x2ad>
+ DB 225,61 ; loope 713d <.literal16+0x2ad>
DB 0,0 ; add %al,(%eax)
DB 128,63,0 ; cmpb $0x0,(%edi)
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%eax)
@@ -47710,16 +45272,16 @@ ALIGN 16
DB 63 ; aas
DB 61,10,23,63,174 ; cmp $0xae3f170a,%eax
DB 71 ; inc %edi
- DB 225,61 ; loope 9451 <.literal16+0x2e1>
+ DB 225,61 ; loope 7171 <.literal16+0x2e1>
DB 174 ; scas %es:(%edi),%al
DB 71 ; inc %edi
- DB 225,61 ; loope 9455 <.literal16+0x2e5>
+ DB 225,61 ; loope 7175 <.literal16+0x2e5>
DB 174 ; scas %es:(%edi),%al
DB 71 ; inc %edi
- DB 225,61 ; loope 9459 <.literal16+0x2e9>
+ DB 225,61 ; loope 7179 <.literal16+0x2e9>
DB 174 ; scas %es:(%edi),%al
DB 71 ; inc %edi
- DB 225,61 ; loope 945d <.literal16+0x2ed>
+ DB 225,61 ; loope 717d <.literal16+0x2ed>
DB 0,0 ; add %al,(%eax)
DB 128,63,0 ; cmpb $0x0,(%edi)
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%eax)
@@ -47741,11 +45303,11 @@ ALIGN 16
DB 0,128,63,0,0,127 ; add %al,0x7f00003f(%eax)
DB 67 ; inc %ebx
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg 949b <.literal16+0x32b>
+ DB 127,67 ; jg 71bb <.literal16+0x32b>
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg 949f <.literal16+0x32f>
+ DB 127,67 ; jg 71bf <.literal16+0x32f>
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg 94a3 <.literal16+0x333>
+ DB 127,67 ; jg 71c3 <.literal16+0x333>
DB 0,0 ; add %al,(%eax)
DB 128,63,0 ; cmpb $0x0,(%edi)
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%eax)
@@ -48014,13 +45576,13 @@ ALIGN 16
DB 132,55 ; test %dh,(%edi)
DB 8,33 ; or %ah,(%ecx)
DB 132,55 ; test %dh,(%edi)
- DB 224,7 ; loopne 96e9 <.literal16+0x579>
+ DB 224,7 ; loopne 7409 <.literal16+0x579>
DB 0,0 ; add %al,(%eax)
- DB 224,7 ; loopne 96ed <.literal16+0x57d>
+ DB 224,7 ; loopne 740d <.literal16+0x57d>
DB 0,0 ; add %al,(%eax)
- DB 224,7 ; loopne 96f1 <.literal16+0x581>
+ DB 224,7 ; loopne 7411 <.literal16+0x581>
DB 0,0 ; add %al,(%eax)
- DB 224,7 ; loopne 96f5 <.literal16+0x585>
+ DB 224,7 ; loopne 7415 <.literal16+0x585>
DB 0,0 ; add %al,(%eax)
DB 33,8 ; and %ecx,(%eax)
DB 2,58 ; add (%edx),%bh
@@ -48069,11 +45631,11 @@ ALIGN 16
DB 128,63,0 ; cmpb $0x0,(%edi)
DB 0,127,67 ; add %bh,0x43(%edi)
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg 97ab <.literal16+0x63b>
+ DB 127,67 ; jg 74cb <.literal16+0x63b>
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg 97af <.literal16+0x63f>
+ DB 127,67 ; jg 74cf <.literal16+0x63f>
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg 97b3 <.literal16+0x643>
+ DB 127,67 ; jg 74d3 <.literal16+0x643>
DB 129,128,128,59,129,128,128,59,129,128; addl $0x80813b80,-0x7f7ec480(%eax)
DB 128,59,129 ; cmpb $0x81,(%ebx)
DB 128,128,59,129,128,128,59 ; addb $0x3b,-0x7f7f7ec5(%eax)
@@ -48088,16 +45650,16 @@ ALIGN 16
DB 0,0 ; add %al,(%eax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 97a4 <.literal16+0x634>
+ DB 127,0 ; jg 74c4 <.literal16+0x634>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 97a8 <.literal16+0x638>
+ DB 127,0 ; jg 74c8 <.literal16+0x638>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 97ac <.literal16+0x63c>
+ DB 127,0 ; jg 74cc <.literal16+0x63c>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 97b0 <.literal16+0x640>
+ DB 127,0 ; jg 74d0 <.literal16+0x640>
DB 0,0 ; add %al,(%eax)
DB 0,63 ; add %bh,(%edi)
DB 0,0 ; add %al,(%eax)
@@ -48106,7 +45668,7 @@ ALIGN 16
DB 0,63 ; add %bh,(%edi)
DB 0,0 ; add %al,(%eax)
DB 0,63 ; add %bh,(%edi)
- DB 119,115 ; ja 9835 <.literal16+0x6c5>
+ DB 119,115 ; ja 7555 <.literal16+0x6c5>
DB 248 ; clc
DB 194,119,115 ; ret $0x7377
DB 248 ; clc
@@ -48117,7 +45679,7 @@ ALIGN 16
DB 194,117,191 ; ret $0xbf75
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; aas
- DB 117,191 ; jne 9799 <.literal16+0x629>
+ DB 117,191 ; jne 74b9 <.literal16+0x629>
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; aas
DB 249 ; stc
@@ -48133,7 +45695,7 @@ ALIGN 16
DB 68 ; inc %esp
DB 180,62 ; mov $0x3e,%ah
DB 163,233,220,63,163 ; mov %eax,0xa33fdce9
- DB 233,220,63,163,233 ; jmp e9a3d7d6 <_sk_callback_sse2+0xe9a3474c>
+ DB 233,220,63,163,233 ; jmp e9a3b4f6 <_sk_callback_sse2+0xe9a3471f>
DB 220,63 ; fdivrl (%edi)
DB 163,233,220,63,0 ; mov %eax,0x3fdce9
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%eax)
@@ -48188,16 +45750,16 @@ ALIGN 16
DB 0,0 ; add %al,(%eax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 9874 <.literal16+0x704>
+ DB 127,0 ; jg 7594 <.literal16+0x704>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 9878 <.literal16+0x708>
+ DB 127,0 ; jg 7598 <.literal16+0x708>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 987c <.literal16+0x70c>
+ DB 127,0 ; jg 759c <.literal16+0x70c>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 9880 <.literal16+0x710>
+ DB 127,0 ; jg 75a0 <.literal16+0x710>
DB 0,0 ; add %al,(%eax)
DB 0,63 ; add %bh,(%edi)
DB 0,0 ; add %al,(%eax)
@@ -48206,7 +45768,7 @@ ALIGN 16
DB 0,63 ; add %bh,(%edi)
DB 0,0 ; add %al,(%eax)
DB 0,63 ; add %bh,(%edi)
- DB 119,115 ; ja 9905 <.literal16+0x795>
+ DB 119,115 ; ja 7625 <.literal16+0x795>
DB 248 ; clc
DB 194,119,115 ; ret $0x7377
DB 248 ; clc
@@ -48217,7 +45779,7 @@ ALIGN 16
DB 194,117,191 ; ret $0xbf75
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; aas
- DB 117,191 ; jne 9869 <.literal16+0x6f9>
+ DB 117,191 ; jne 7589 <.literal16+0x6f9>
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; aas
DB 249 ; stc
@@ -48233,7 +45795,7 @@ ALIGN 16
DB 68 ; inc %esp
DB 180,62 ; mov $0x3e,%ah
DB 163,233,220,63,163 ; mov %eax,0xa33fdce9
- DB 233,220,63,163,233 ; jmp e9a3d8a6 <_sk_callback_sse2+0xe9a3481c>
+ DB 233,220,63,163,233 ; jmp e9a3b5c6 <_sk_callback_sse2+0xe9a347ef>
DB 220,63 ; fdivrl (%edi)
DB 163,233,220,63,0 ; mov %eax,0x3fdce9
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%eax)
@@ -48288,16 +45850,16 @@ ALIGN 16
DB 0,0 ; add %al,(%eax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 9944 <.literal16+0x7d4>
+ DB 127,0 ; jg 7664 <.literal16+0x7d4>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 9948 <.literal16+0x7d8>
+ DB 127,0 ; jg 7668 <.literal16+0x7d8>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 994c <.literal16+0x7dc>
+ DB 127,0 ; jg 766c <.literal16+0x7dc>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 9950 <.literal16+0x7e0>
+ DB 127,0 ; jg 7670 <.literal16+0x7e0>
DB 0,0 ; add %al,(%eax)
DB 0,63 ; add %bh,(%edi)
DB 0,0 ; add %al,(%eax)
@@ -48306,7 +45868,7 @@ ALIGN 16
DB 0,63 ; add %bh,(%edi)
DB 0,0 ; add %al,(%eax)
DB 0,63 ; add %bh,(%edi)
- DB 119,115 ; ja 99d5 <.literal16+0x865>
+ DB 119,115 ; ja 76f5 <.literal16+0x865>
DB 248 ; clc
DB 194,119,115 ; ret $0x7377
DB 248 ; clc
@@ -48317,7 +45879,7 @@ ALIGN 16
DB 194,117,191 ; ret $0xbf75
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; aas
- DB 117,191 ; jne 9939 <.literal16+0x7c9>
+ DB 117,191 ; jne 7659 <.literal16+0x7c9>
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; aas
DB 249 ; stc
@@ -48333,7 +45895,7 @@ ALIGN 16
DB 68 ; inc %esp
DB 180,62 ; mov $0x3e,%ah
DB 163,233,220,63,163 ; mov %eax,0xa33fdce9
- DB 233,220,63,163,233 ; jmp e9a3d976 <_sk_callback_sse2+0xe9a348ec>
+ DB 233,220,63,163,233 ; jmp e9a3b696 <_sk_callback_sse2+0xe9a348bf>
DB 220,63 ; fdivrl (%edi)
DB 163,233,220,63,0 ; mov %eax,0x3fdce9
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%eax)
@@ -48388,16 +45950,16 @@ ALIGN 16
DB 0,0 ; add %al,(%eax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 9a14 <.literal16+0x8a4>
+ DB 127,0 ; jg 7734 <.literal16+0x8a4>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 9a18 <.literal16+0x8a8>
+ DB 127,0 ; jg 7738 <.literal16+0x8a8>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 9a1c <.literal16+0x8ac>
+ DB 127,0 ; jg 773c <.literal16+0x8ac>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 9a20 <.literal16+0x8b0>
+ DB 127,0 ; jg 7740 <.literal16+0x8b0>
DB 0,0 ; add %al,(%eax)
DB 0,63 ; add %bh,(%edi)
DB 0,0 ; add %al,(%eax)
@@ -48406,7 +45968,7 @@ ALIGN 16
DB 0,63 ; add %bh,(%edi)
DB 0,0 ; add %al,(%eax)
DB 0,63 ; add %bh,(%edi)
- DB 119,115 ; ja 9aa5 <.literal16+0x935>
+ DB 119,115 ; ja 77c5 <.literal16+0x935>
DB 248 ; clc
DB 194,119,115 ; ret $0x7377
DB 248 ; clc
@@ -48417,7 +45979,7 @@ ALIGN 16
DB 194,117,191 ; ret $0xbf75
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; aas
- DB 117,191 ; jne 9a09 <.literal16+0x899>
+ DB 117,191 ; jne 7729 <.literal16+0x899>
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; aas
DB 249 ; stc
@@ -48433,7 +45995,7 @@ ALIGN 16
DB 68 ; inc %esp
DB 180,62 ; mov $0x3e,%ah
DB 163,233,220,63,163 ; mov %eax,0xa33fdce9
- DB 233,220,63,163,233 ; jmp e9a3da46 <_sk_callback_sse2+0xe9a349bc>
+ DB 233,220,63,163,233 ; jmp e9a3b766 <_sk_callback_sse2+0xe9a3498f>
DB 220,63 ; fdivrl (%edi)
DB 163,233,220,63,0 ; mov %eax,0x3fdce9
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%eax)
@@ -48484,13 +46046,13 @@ ALIGN 16
DB 200,66,0,0 ; enter $0x42,$0x0
DB 200,66,0,0 ; enter $0x42,$0x0
DB 200,66,0,0 ; enter $0x42,$0x0
- DB 127,67 ; jg 9b27 <.literal16+0x9b7>
+ DB 127,67 ; jg 7847 <.literal16+0x9b7>
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg 9b2b <.literal16+0x9bb>
+ DB 127,67 ; jg 784b <.literal16+0x9bb>
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg 9b2f <.literal16+0x9bf>
+ DB 127,67 ; jg 784f <.literal16+0x9bf>
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg 9b33 <.literal16+0x9c3>
+ DB 127,67 ; jg 7853 <.literal16+0x9c3>
DB 0,0 ; add %al,(%eax)
DB 0,195 ; add %al,%bl
DB 0,0 ; add %al,(%eax)
@@ -48541,16 +46103,16 @@ ALIGN 16
DB 128,3,62 ; addb $0x3e,(%ebx)
DB 31 ; pop %ds
DB 215 ; xlat %ds:(%ebx)
- DB 118,63 ; jbe 9bb3 <.literal16+0xa43>
+ DB 118,63 ; jbe 78d3 <.literal16+0xa43>
DB 31 ; pop %ds
DB 215 ; xlat %ds:(%ebx)
- DB 118,63 ; jbe 9bb7 <.literal16+0xa47>
+ DB 118,63 ; jbe 78d7 <.literal16+0xa47>
DB 31 ; pop %ds
DB 215 ; xlat %ds:(%ebx)
- DB 118,63 ; jbe 9bbb <.literal16+0xa4b>
+ DB 118,63 ; jbe 78db <.literal16+0xa4b>
DB 31 ; pop %ds
DB 215 ; xlat %ds:(%ebx)
- DB 118,63 ; jbe 9bbf <.literal16+0xa4f>
+ DB 118,63 ; jbe 78df <.literal16+0xa4f>
DB 246,64,83,63 ; testb $0x3f,0x53(%eax)
DB 246,64,83,63 ; testb $0x3f,0x53(%eax)
DB 246,64,83,63 ; testb $0x3f,0x53(%eax)
@@ -48579,11 +46141,11 @@ ALIGN 16
DB 128,59,0 ; cmpb $0x0,(%ebx)
DB 0,127,67 ; add %bh,0x43(%edi)
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg 9c2b <.literal16+0xabb>
+ DB 127,67 ; jg 794b <.literal16+0xabb>
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg 9c2f <.literal16+0xabf>
+ DB 127,67 ; jg 794f <.literal16+0xabf>
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg 9c33 <.literal16+0xac3>
+ DB 127,67 ; jg 7953 <.literal16+0xac3>
DB 255,0 ; incl (%eax)
DB 0,0 ; add %al,(%eax)
DB 0,0 ; add %al,(%eax)
@@ -48645,13 +46207,13 @@ ALIGN 16
DB 132,55 ; test %dh,(%edi)
DB 8,33 ; or %ah,(%ecx)
DB 132,55 ; test %dh,(%edi)
- DB 224,7 ; loopne 9ca9 <.literal16+0xb39>
+ DB 224,7 ; loopne 79c9 <.literal16+0xb39>
DB 0,0 ; add %al,(%eax)
- DB 224,7 ; loopne 9cad <.literal16+0xb3d>
+ DB 224,7 ; loopne 79cd <.literal16+0xb3d>
DB 0,0 ; add %al,(%eax)
- DB 224,7 ; loopne 9cb1 <.literal16+0xb41>
+ DB 224,7 ; loopne 79d1 <.literal16+0xb41>
DB 0,0 ; add %al,(%eax)
- DB 224,7 ; loopne 9cb5 <.literal16+0xb45>
+ DB 224,7 ; loopne 79d5 <.literal16+0xb45>
DB 0,0 ; add %al,(%eax)
DB 33,8 ; and %ecx,(%eax)
DB 2,58 ; add (%edx),%bh
@@ -48697,13 +46259,13 @@ ALIGN 16
DB 132,55 ; test %dh,(%edi)
DB 8,33 ; or %ah,(%ecx)
DB 132,55 ; test %dh,(%edi)
- DB 224,7 ; loopne 9d19 <.literal16+0xba9>
+ DB 224,7 ; loopne 7a39 <.literal16+0xba9>
DB 0,0 ; add %al,(%eax)
- DB 224,7 ; loopne 9d1d <.literal16+0xbad>
+ DB 224,7 ; loopne 7a3d <.literal16+0xbad>
DB 0,0 ; add %al,(%eax)
- DB 224,7 ; loopne 9d21 <.literal16+0xbb1>
+ DB 224,7 ; loopne 7a41 <.literal16+0xbb1>
DB 0,0 ; add %al,(%eax)
- DB 224,7 ; loopne 9d25 <.literal16+0xbb5>
+ DB 224,7 ; loopne 7a45 <.literal16+0xbb5>
DB 0,0 ; add %al,(%eax)
DB 33,8 ; and %ecx,(%eax)
DB 2,58 ; add (%edx),%bh
@@ -48749,13 +46311,13 @@ ALIGN 16
DB 132,55 ; test %dh,(%edi)
DB 8,33 ; or %ah,(%ecx)
DB 132,55 ; test %dh,(%edi)
- DB 224,7 ; loopne 9d89 <.literal16+0xc19>
+ DB 224,7 ; loopne 7aa9 <.literal16+0xc19>
DB 0,0 ; add %al,(%eax)
- DB 224,7 ; loopne 9d8d <.literal16+0xc1d>
+ DB 224,7 ; loopne 7aad <.literal16+0xc1d>
DB 0,0 ; add %al,(%eax)
- DB 224,7 ; loopne 9d91 <.literal16+0xc21>
+ DB 224,7 ; loopne 7ab1 <.literal16+0xc21>
DB 0,0 ; add %al,(%eax)
- DB 224,7 ; loopne 9d95 <.literal16+0xc25>
+ DB 224,7 ; loopne 7ab5 <.literal16+0xc25>
DB 0,0 ; add %al,(%eax)
DB 33,8 ; and %ecx,(%eax)
DB 2,58 ; add (%edx),%bh
@@ -48797,13 +46359,13 @@ ALIGN 16
DB 248 ; clc
DB 65 ; inc %ecx
DB 0,0 ; add %al,(%eax)
- DB 124,66 ; jl 9e26 <.literal16+0xcb6>
+ DB 124,66 ; jl 7b46 <.literal16+0xcb6>
DB 0,0 ; add %al,(%eax)
- DB 124,66 ; jl 9e2a <.literal16+0xcba>
+ DB 124,66 ; jl 7b4a <.literal16+0xcba>
DB 0,0 ; add %al,(%eax)
- DB 124,66 ; jl 9e2e <.literal16+0xcbe>
+ DB 124,66 ; jl 7b4e <.literal16+0xcbe>
DB 0,0 ; add %al,(%eax)
- DB 124,66 ; jl 9e32 <.literal16+0xcc2>
+ DB 124,66 ; jl 7b52 <.literal16+0xcc2>
DB 0,240 ; add %dh,%al
DB 0,0 ; add %al,(%eax)
DB 0,240 ; add %dh,%al
@@ -48937,13 +46499,13 @@ ALIGN 16
DB 136,136,61,137,136,136 ; mov %cl,-0x777776c3(%eax)
DB 61,137,136,136,61 ; cmp $0x3d888889,%eax
DB 0,0 ; add %al,(%eax)
- DB 112,65 ; jo 9fb5 <.literal16+0xe45>
+ DB 112,65 ; jo 7cd5 <.literal16+0xe45>
DB 0,0 ; add %al,(%eax)
- DB 112,65 ; jo 9fb9 <.literal16+0xe49>
+ DB 112,65 ; jo 7cd9 <.literal16+0xe49>
DB 0,0 ; add %al,(%eax)
- DB 112,65 ; jo 9fbd <.literal16+0xe4d>
+ DB 112,65 ; jo 7cdd <.literal16+0xe4d>
DB 0,0 ; add %al,(%eax)
- DB 112,65 ; jo 9fc1 <.literal16+0xe51>
+ DB 112,65 ; jo 7ce1 <.literal16+0xe51>
DB 255,0 ; incl (%eax)
DB 0,0 ; add %al,(%eax)
DB 255,0 ; incl (%eax)
@@ -48974,11 +46536,11 @@ ALIGN 16
DB 128,59,129 ; cmpb $0x81,(%ebx)
DB 128,128,59,0,0,127,67 ; addb $0x43,0x7f00003b(%eax)
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg a02b <.literal16+0xebb>
+ DB 127,67 ; jg 7d4b <.literal16+0xebb>
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg a02f <.literal16+0xebf>
+ DB 127,67 ; jg 7d4f <.literal16+0xebf>
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg a033 <.literal16+0xec3>
+ DB 127,67 ; jg 7d53 <.literal16+0xec3>
DB 255,0 ; incl (%eax)
DB 0,0 ; add %al,(%eax)
DB 255,0 ; incl (%eax)
@@ -49009,11 +46571,11 @@ ALIGN 16
DB 128,59,129 ; cmpb $0x81,(%ebx)
DB 128,128,59,0,0,127,67 ; addb $0x43,0x7f00003b(%eax)
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg a09b <.literal16+0xf2b>
+ DB 127,67 ; jg 7dbb <.literal16+0xf2b>
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg a09f <.literal16+0xf2f>
+ DB 127,67 ; jg 7dbf <.literal16+0xf2f>
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg a0a3 <.literal16+0xf33>
+ DB 127,67 ; jg 7dc3 <.literal16+0xf33>
DB 0,128,0,0,0,128 ; add %al,-0x80000000(%eax)
DB 0,0 ; add %al,(%eax)
DB 0,128,0,0,0,128 ; add %al,-0x80000000(%eax)
@@ -49112,13 +46674,13 @@ ALIGN 16
DB 0,0 ; add %al,(%eax)
DB 128,63,0 ; cmpb $0x0,(%edi)
DB 255 ; (bad)
- DB 127,71 ; jg a1cb <.literal16+0x105b>
+ DB 127,71 ; jg 7eeb <.literal16+0x105b>
DB 0,255 ; add %bh,%bh
- DB 127,71 ; jg a1cf <.literal16+0x105f>
+ DB 127,71 ; jg 7eef <.literal16+0x105f>
DB 0,255 ; add %bh,%bh
- DB 127,71 ; jg a1d3 <.literal16+0x1063>
+ DB 127,71 ; jg 7ef3 <.literal16+0x1063>
DB 0,255 ; add %bh,%bh
- DB 127,71 ; jg a1d7 <.literal16+0x1067>
+ DB 127,71 ; jg 7ef7 <.literal16+0x1067>
DB 0,0 ; add %al,(%eax)
DB 128,63,0 ; cmpb $0x0,(%edi)
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%eax)
@@ -49226,7 +46788,7 @@ ALIGN 16
DB 192,45,16,17,192,45,16 ; shrb $0x10,0x2dc01110
DB 17,192 ; adc %eax,%eax
DB 45,16,17,192,18 ; sub $0x12c01110,%eax
- DB 120,57 ; js a2dc <.literal16+0x116c>
+ DB 120,57 ; js 7ffc <.literal16+0x116c>
DB 64 ; inc %eax
DB 18,120,57 ; adc 0x39(%eax),%bh
DB 64 ; inc %eax
@@ -49419,11 +46981,11 @@ ALIGN 16
DB 0,0 ; add %al,(%eax)
DB 128,63,114 ; cmpb $0x72,(%edi)
DB 28,199 ; sbb $0xc7,%al
- DB 62,114,28 ; jb,pt a4c2 <.literal16+0x1352>
+ DB 62,114,28 ; jb,pt 81e2 <.literal16+0x1352>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt a4c6 <.literal16+0x1356>
+ DB 62,114,28 ; jb,pt 81e6 <.literal16+0x1356>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt a4ca <.literal16+0x135a>
+ DB 62,114,28 ; jb,pt 81ea <.literal16+0x135a>
DB 199 ; (bad)
DB 62,171 ; ds stos %eax,%es:(%edi)
DB 170 ; stos %al,%es:(%edi)
@@ -49502,13 +47064,13 @@ ALIGN 16
DB 192,63,0 ; sarb $0x0,(%edi)
DB 0,192 ; add %al,%al
DB 63 ; aas
- DB 114,28 ; jb a58e <.literal16+0x141e>
+ DB 114,28 ; jb 82ae <.literal16+0x141e>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt a592 <.literal16+0x1422>
+ DB 62,114,28 ; jb,pt 82b2 <.literal16+0x1422>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt a596 <.literal16+0x1426>
+ DB 62,114,28 ; jb,pt 82b6 <.literal16+0x1426>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt a59a <.literal16+0x142a>
+ DB 62,114,28 ; jb,pt 82ba <.literal16+0x142a>
DB 199 ; (bad)
DB 62,171 ; ds stos %eax,%es:(%edi)
DB 170 ; stos %al,%es:(%edi)
@@ -49529,11 +47091,11 @@ ALIGN 16
DB 0,0 ; add %al,(%eax)
DB 128,63,114 ; cmpb $0x72,(%edi)
DB 28,199 ; sbb $0xc7,%al
- DB 62,114,28 ; jb,pt a5d2 <.literal16+0x1462>
+ DB 62,114,28 ; jb,pt 82f2 <.literal16+0x1462>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt a5d6 <.literal16+0x1466>
+ DB 62,114,28 ; jb,pt 82f6 <.literal16+0x1466>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt a5da <.literal16+0x146a>
+ DB 62,114,28 ; jb,pt 82fa <.literal16+0x146a>
DB 199 ; (bad)
DB 62,171 ; ds stos %eax,%es:(%edi)
DB 170 ; stos %al,%es:(%edi)
@@ -49612,13 +47174,13 @@ ALIGN 16
DB 192,63,0 ; sarb $0x0,(%edi)
DB 0,192 ; add %al,%al
DB 63 ; aas
- DB 114,28 ; jb a69e <.literal16+0x152e>
+ DB 114,28 ; jb 83be <.literal16+0x152e>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt a6a2 <_sk_callback_sse2+0x1618>
+ DB 62,114,28 ; jb,pt 83c2 <_sk_callback_sse2+0x15eb>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt a6a6 <_sk_callback_sse2+0x161c>
+ DB 62,114,28 ; jb,pt 83c6 <_sk_callback_sse2+0x15ef>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt a6aa <_sk_callback_sse2+0x1620>
+ DB 62,114,28 ; jb,pt 83ca <_sk_callback_sse2+0x15f3>
DB 199 ; (bad)
DB 62,171 ; ds stos %eax,%es:(%edi)
DB 170 ; stos %al,%es:(%edi)
diff --git a/src/jumper/SkJumper_stages.cpp b/src/jumper/SkJumper_stages.cpp
index 4d78e9d0f3..47e3ad22ea 100644
--- a/src/jumper/SkJumper_stages.cpp
+++ b/src/jumper/SkJumper_stages.cpp
@@ -42,9 +42,22 @@ using K = const SkJumper_constants;
// tail == 0 ~~> work on a full kStride pixels
// tail != 0 ~~> work on only the first tail pixels
// tail is always < kStride.
-//
-// We keep program the second argument, so that it's passed in rsi for load_and_inc().
-using Stage = void(K* k, void** program, size_t x, size_t y, size_t tail, F,F,F,F, F,F,F,F);
+
+#if defined(__i386__) || defined(_M_IX86)
+ // On 32-bit x86 we've only got 8 xmm registers, so we keep the 4 hottest (r,g,b,a)
+ // in registers and the d-registers on the stack (giving us 4 temporary registers).
+ // General-purpose registers are also tight, so we put most of those on the stack too.
+ struct Params {
+ size_t x, y, tail;
+ K* k;
+ F dr,dg,db,da;
+ };
+ using Stage = void(Params*, void** program, F r, F g, F b, F a);
+
+#else
+ // We keep program the second argument, so that it's passed in rsi for load_and_inc().
+ using Stage = void(K* k, void** program, size_t x, size_t y, size_t tail, F,F,F,F, F,F,F,F);
+#endif
#if defined(JUMPER) && defined(__AVX__)
// We really want to make sure all paths go through this function's (implicit) vzeroupper.
@@ -60,8 +73,19 @@ extern "C" void WRAP(start_pipeline)(size_t x, size_t y, size_t xlimit, size_t y
F v{};
#endif
auto start = (Stage*)load_and_inc(program);
- size_t x0 = x;
+ const size_t x0 = x;
for (; y < ylimit; y++) {
+ #if defined(__i386__) || defined(_M_IX86)
+ Params params = { x0,y,0,k, v,v,v,v };
+ while (params.x + kStride <= xlimit) {
+ start(&params,program, v,v,v,v);
+ params.x += kStride;
+ }
+ if (size_t tail = xlimit - params.x) {
+ params.tail = tail;
+ start(&params,program, v,v,v,v);
+ }
+ #else
x = x0;
while (x + kStride <= xlimit) {
start(k,program,x,y,0, v,v,v,v, v,v,v,v);
@@ -70,26 +94,47 @@ extern "C" void WRAP(start_pipeline)(size_t x, size_t y, size_t xlimit, size_t y
if (size_t tail = xlimit - x) {
start(k,program,x,y,tail, v,v,v,v, v,v,v,v);
}
+ #endif
}
}
-#define STAGE(name) \
- SI void name##_k(K* k, LazyCtx ctx, size_t x, size_t y, size_t tail, \
- F& r, F& g, F& b, F& a, F& dr, F& dg, F& db, F& da); \
- extern "C" void WRAP(name)(K* k, void** program, size_t x, size_t y, size_t tail, \
- F r, F g, F b, F a, F dr, F dg, F db, F da) { \
- LazyCtx ctx(program); \
- name##_k(k,ctx,x,y,tail, r,g,b,a, dr,dg,db,da); \
- auto next = (Stage*)load_and_inc(program); \
- next(k,program,x,y,tail, r,g,b,a, dr,dg,db,da); \
- } \
- SI void name##_k(K* k, LazyCtx ctx, size_t x, size_t y, size_t tail, \
- F& r, F& g, F& b, F& a, F& dr, F& dg, F& db, F& da)
+#if defined(__i386__) || defined(_M_IX86)
+ #define STAGE(name) \
+ SI void name##_k(K* k, LazyCtx ctx, size_t x, size_t y, size_t tail, \
+ F& r, F& g, F& b, F& a, F& dr, F& dg, F& db, F& da); \
+ extern "C" void WRAP(name)(Params* params, void** program, \
+ F r, F g, F b, F a) { \
+ LazyCtx ctx(program); \
+ name##_k(params->k,ctx,params->x,params->y,params->tail, r,g,b,a, \
+ params->dr, params->dg, params->db, params->da); \
+ auto next = (Stage*)load_and_inc(program); \
+ next(params,program, r,g,b,a); \
+ } \
+ SI void name##_k(K* k, LazyCtx ctx, size_t x, size_t y, size_t tail, \
+ F& r, F& g, F& b, F& a, F& dr, F& dg, F& db, F& da)
+#else
+ #define STAGE(name) \
+ SI void name##_k(K* k, LazyCtx ctx, size_t x, size_t y, size_t tail, \
+ F& r, F& g, F& b, F& a, F& dr, F& dg, F& db, F& da); \
+ extern "C" void WRAP(name)(K* k, void** program, size_t x, size_t y, size_t tail, \
+ F r, F g, F b, F a, F dr, F dg, F db, F da) { \
+ LazyCtx ctx(program); \
+ name##_k(k,ctx,x,y,tail, r,g,b,a, dr,dg,db,da); \
+ auto next = (Stage*)load_and_inc(program); \
+ next(k,program,x,y,tail, r,g,b,a, dr,dg,db,da); \
+ } \
+ SI void name##_k(K* k, LazyCtx ctx, size_t x, size_t y, size_t tail, \
+ F& r, F& g, F& b, F& a, F& dr, F& dg, F& db, F& da)
+#endif
// just_return() is a simple no-op stage that only exists to end the chain,
// returning back up to start_pipeline(), and from there to the caller.
-extern "C" void WRAP(just_return)(K*, void**, size_t,size_t,size_t, F,F,F,F, F,F,F,F) {}
+#if defined(__i386__) || defined(_M_IX86)
+ extern "C" void WRAP(just_return)(Params*, void**, F,F,F,F) {}
+#else
+ extern "C" void WRAP(just_return)(K*, void**, size_t,size_t,size_t, F,F,F,F, F,F,F,F) {}
+#endif
// We could start defining normal Stages now. But first, some helper functions.