📄 pngvcrd.c

📁 神龙卡开发原代码
💻 C
📖 第 1 页 / 共 5 页
字号:
               register int disp = png_pass_inc[png_ptr->pass];               int offset_table[7] = {0, 4, 0, 2, 0, 1, 0};               pixel_bytes = (png_ptr->row_info.pixel_depth >> 3);               srcptr = png_ptr->row_buf + 1 + offset_table[png_ptr->pass]*                  pixel_bytes;               dstptr = row + offset_table[png_ptr->pass]*pixel_bytes;               initial_val = offset_table[png_ptr->pass]*pixel_bytes;               final_val = png_ptr->width*pixel_bytes;               incr1 = (disp)*pixel_bytes;               for (i = initial_val; i < final_val; i += incr1)               {                  if (pixel_bytes > (png_size_t)(final_val-i))                    pixel_bytes = (png_size_t)(final_val-i);                  png_memcpy(dstptr, srcptr, pixel_bytes);                  srcptr += incr1;                  dstptr += incr1;               }            } /* end of else */            break;         }       // end 8 bpp         case 16:         {            png_bytep srcptr;            png_bytep dstptr;            png_uint_32 len;            int unmask, diff;            __int64 mask1=0x0101020204040808,                    mask0=0x1010202040408080;            if ( mmx_supported )            {               srcptr = png_ptr->row_buf + 1;               dstptr = row;               unmask = ~mask;               len     = (png_ptr->width)&~7;               diff = (png_ptr->width)&7;               _asm               {                  movd       mm7, unmask       //load bit pattern                  psubb      mm6,mm6           //zero mm6                  punpcklbw  mm7,mm7                  punpcklwd  mm7,mm7                  punpckldq  mm7,mm7           //fill register with 8 masks                  movq       mm0,mask0                  movq       mm1,mask1                  pand       mm0,mm7                  pand       mm1,mm7                  pcmpeqb    mm0,mm6                  pcmpeqb    mm1,mm6                  mov        ecx,len           //load length of line                  mov        esi,srcptr        //load source                  mov        ebx,dstptr        //load dest                  cmp        ecx,0             //lcr                  jz         mainloop16endmainloop16:                  movq       mm4,[esi]                  pand       mm4,mm0                  movq       mm6,mm0                  movq       mm7,[ebx]                  pandn      mm6,mm7                  por        mm4,mm6                  movq       [ebx],mm4                  movq       mm5,[esi+8]                  pand       mm5,mm1                  movq       mm7,mm1                  movq       mm6,[ebx+8]                  pandn      mm7,mm6                  por        mm5,mm7                  movq       [ebx+8],mm5                  add        esi,16            //inc by 16 bytes processed                  add        ebx,16                  sub        ecx,8             //dec by 8 pixels processed                  ja         mainloop16mainloop16end:                  mov        ecx,diff                  cmp        ecx,0                  jz         end16                  mov        edx,mask                  sal        edx,24            //make low byte the high bytesecondloop16:                  sal        edx,1             //move high bit to CF                  jnc        skip16            //if CF = 0                  mov        ax,[esi]                  mov        [ebx],axskip16:                  add        esi,2                  add        ebx,2                  dec        ecx                  jnz        secondloop16end16:                  emms               }            }            else /* mmx not supported - use modified C routine */            {               register unsigned int incr1, initial_val, final_val;               png_size_t pixel_bytes;               png_uint_32 i;               register int disp = png_pass_inc[png_ptr->pass];               int offset_table[7] = {0, 4, 0, 2, 0, 1, 0};               pixel_bytes = (png_ptr->row_info.pixel_depth >> 3);               srcptr = png_ptr->row_buf + 1 + offset_table[png_ptr->pass]*                  pixel_bytes;               dstptr = row + offset_table[png_ptr->pass]*pixel_bytes;               initial_val = offset_table[png_ptr->pass]*pixel_bytes;               final_val = png_ptr->width*pixel_bytes;               incr1 = (disp)*pixel_bytes;               for (i = initial_val; i < final_val; i += incr1)               {                  if (pixel_bytes > (png_size_t)(final_val-i))                    pixel_bytes = (png_size_t)(final_val-i);                  png_memcpy(dstptr, srcptr, pixel_bytes);                  srcptr += incr1;                  dstptr += incr1;               }            } /* end of else */            break;         }       // end 16 bpp         case 24:         {            png_bytep srcptr;            png_bytep dstptr;            png_uint_32 len;            int unmask, diff;            __int64 mask2=0x0101010202020404,  //24bpp                    mask1=0x0408080810101020,                    mask0=0x2020404040808080;            srcptr = png_ptr->row_buf + 1;            dstptr = row;            unmask = ~mask;            len     = (png_ptr->width)&~7;            diff = (png_ptr->width)&7;            if ( mmx_supported )            {               _asm               {                  movd       mm7, unmask       //load bit pattern                  psubb      mm6,mm6           //zero mm6                  punpcklbw  mm7,mm7                  punpcklwd  mm7,mm7                  punpckldq  mm7,mm7           //fill register with 8 masks                  movq       mm0,mask0                  movq       mm1,mask1                  movq       mm2,mask2                  pand       mm0,mm7                  pand       mm1,mm7                  pand       mm2,mm7                  pcmpeqb    mm0,mm6                  pcmpeqb    mm1,mm6                  pcmpeqb    mm2,mm6                  mov        ecx,len           //load length of line                  mov        esi,srcptr        //load source                  mov        ebx,dstptr        //load dest                  cmp        ecx,0                  jz         mainloop24endmainloop24:                  movq       mm4,[esi]                  pand       mm4,mm0                  movq       mm6,mm0                  movq       mm7,[ebx]                  pandn      mm6,mm7                  por        mm4,mm6                  movq       [ebx],mm4                  movq       mm5,[esi+8]                  pand       mm5,mm1                  movq       mm7,mm1                  movq       mm6,[ebx+8]                  pandn      mm7,mm6                  por        mm5,mm7                  movq       [ebx+8],mm5                  movq       mm6,[esi+16]                  pand       mm6,mm2                  movq       mm4,mm2                  movq       mm7,[ebx+16]                  pandn      mm4,mm7                  por        mm6,mm4                  movq       [ebx+16],mm6                  add        esi,24            //inc by 24 bytes processed                  add        ebx,24                  sub        ecx,8             //dec by 8 pixels processed                  ja         mainloop24mainloop24end:                  mov        ecx,diff                  cmp        ecx,0                  jz         end24                  mov        edx,mask                  sal        edx,24            //make low byte the high bytesecondloop24:                  sal        edx,1             //move high bit to CF                  jnc        skip24            //if CF = 0                  mov        ax,[esi]                  mov        [ebx],ax                  xor        eax,eax                  mov        al,[esi+2]                  mov        [ebx+2],alskip24:                  add        esi,3                  add        ebx,3                  dec        ecx                  jnz        secondloop24end24:                  emms               }            }            else /* mmx not supported - use modified C routine */            {               register unsigned int incr1, initial_val, final_val;               png_size_t pixel_bytes;               png_uint_32 i;               register int disp = png_pass_inc[png_ptr->pass];               int offset_table[7] = {0, 4, 0, 2, 0, 1, 0};               pixel_bytes = (png_ptr->row_info.pixel_depth >> 3);               srcptr = png_ptr->row_buf + 1 + offset_table[png_ptr->pass]*                  pixel_bytes;               dstptr = row + offset_table[png_ptr->pass]*pixel_bytes;               initial_val = offset_table[png_ptr->pass]*pixel_bytes;               final_val = png_ptr->width*pixel_bytes;               incr1 = (disp)*pixel_bytes;               for (i = initial_val; i < final_val; i += incr1)               {                  if (pixel_bytes > (png_size_t)(final_val-i))                    pixel_bytes = (png_size_t)(final_val-i);                  png_memcpy(dstptr, srcptr, pixel_bytes);                  srcptr += incr1;                  dstptr += incr1;               }            } /* end of else */            break;         }       // end 24 bpp         case 32:         {            png_bytep srcptr;            png_bytep dstptr;            png_uint_32 len;            int unmask, diff;            __int64 mask3=0x0101010102020202,  //32bpp                    mask2=0x0404040408080808,                    mask1=0x1010101020202020,                    mask0=0x4040404080808080;            srcptr = png_ptr->row_buf + 1;            dstptr = row;            unmask = ~mask;            len     = (png_ptr->width)&~7;            diff = (png_ptr->width)&7;            if ( mmx_supported )            {               _asm               {                  movd       mm7, unmask       //load bit pattern                  psubb      mm6,mm6           //zero mm6                  punpcklbw  mm7,mm7                  punpcklwd  mm7,mm7                  punpckldq  mm7,mm7           //fill register with 8 masks                  movq       mm0,mask0                  movq       mm1,mask1                  movq       mm2,mask2                  movq       mm3,mask3                  pand       mm0,mm7                  pand       mm1,mm7                  pand       mm2,mm7                  pand       mm3,mm7                  pcmpeqb    mm0,mm6                  pcmpeqb    mm1,mm6                  pcmpeqb    mm2,mm6                  pcmpeqb    mm3,mm6                  mov        ecx,len           //load length of line                  mov        esi,srcptr        //load source                  mov        ebx,dstptr        //load dest                  cmp        ecx,0             //lcr                  jz         mainloop32endmainloop32:                  movq       mm4,[esi]                  pand       mm4,mm0                  movq       mm6,mm0                  movq       mm7,[ebx]                  pandn      mm6,mm7                  por        mm4,mm6                  movq       [ebx],mm4                  movq       mm5,[esi+8]                  pand       mm5,mm1                  movq       mm7,mm1                  movq       mm6,[ebx+8]                  pandn      mm7,mm6                  por        mm5,mm7                  movq       [ebx+8],mm5                  movq       mm6,[esi+16]                  pand       mm6,mm2                  movq       mm4,mm2                  movq       mm7,[ebx+16]                  pandn      mm4,mm7                  por        mm6,mm4                  movq       [ebx+16],mm6                  movq       mm7,[esi+24]                  pand       mm7,mm3                  movq       mm5,mm3                  movq       mm4,[ebx+24]                  pandn      mm5,mm4                  por        mm7,mm5                  movq       [ebx+24],mm7                  add        esi,32            //inc by 32 bytes processed                  add        ebx,32                  sub        ecx,8             //dec by 8 pixels processed                  ja         mainloop32mainloop32end:                  mov        ecx,diff                  cmp        ecx,0                  jz         end32                  mov        edx,mask                  sal        edx,24            //make low byte the high bytesecondloop32:                  sal        edx,1             //move high bit to CF                  jnc        skip32            //if CF = 0                  mov        eax,[esi]                  mov        [ebx],eaxskip32:                  add        esi,4
💿 文件大小 6213 K
👤 上传用户 evenxyz
📂 所属分类嵌入式Linux
🏷️ 相关标签

#代码
⌨️ 快捷键说明

复制代码 Ctrl + C
搜索代码 Ctrl + F
全屏模式 F11
切换主题 Ctrl + Shift + D
显示快捷键 ?
增大字号 Ctrl + =
减小字号 Ctrl + -