📄 fdctref.c

📁 avi2mpg1_src 中包含了mpeg1编码的源程序
💻 C
字号:
/* fdctref.c, 前向离散余弦变换，双精度      */
extern unsigned int doublePrecision;
#include <math.h>#ifndef PI# ifdef M_PI#  define PI M_PI# else#  define PI 3.14159265358979323846# endif#endif/* 声明全局函数 */void init_fdct(void);void fdct(short *block);/*声明私有变量*/static double c[8][8];     /*采用浮点运算时的转换系数*/
static short   c2[8][8];   /*采用整数运算时的转换系数*/

/* 关掉由长整型数据转换成双精度数据时产生的警告信息*/
#pragma warning( disable : 4244 )
void init_fdct(){	int i, j;	double s;
	double sTmp;	for (i=0; i<8; i++)	{		s = (i==0) ? sqrt(0.125) : 0.5;
		for (j=0; j<8; j++)
		{			c[i][j] = s * cos((PI/8.0)*i*(j+0.5));
			/* 保存整型数据并左移14位*/
			sTmp = c[i][j] * 16384;
			c2[i][j] = floor(sTmp+0.499999);
		}	}}

/*该函数用来完成DCT变换*/

void fdct(block)short *block;{	int        i, j, k;
	short*     pBlock;
	short*     pC;
	long       s2;
	short      tmp2[64];
	short*     pTmp2;
	double     s;
	double     tmp[64];
	for (i=0; i<8; i++)		for (j=0; j<8; j++)		{
		/*
		* 如果采用的是MMX处理器，则可以用整数运算替代浮点运算来加速处理过程
		* 
		*/
		if (!doublePrecision)
		{
			s2 = 0;
			pC = (short*)c2 + (j*8);
			pBlock = block + (8*i);

			__asm {
			mov         eax, pBlock       ;
			movq        mm0, [eax]        ; //将块0-3放入地址mm0
			movq        mm1, [eax+8]      ; //将块4-7放入地址mm1
			mov         eax, pC           ;
			movq        mm3, [eax]        ;
			movq        mm4, [eax+8]      ;
			pmaddwd     mm0, mm3          ;
			pmaddwd     mm1, mm4          ;

			movd        eax, mm0          ; 
			psrlq       mm0, 0x20         ;
			movd        ebx, mm0          ; 
			add         eax, ebx

			movd        ebx, mm1          ; 
			add         eax, ebx
			psrlq       mm1, 0x20         ;
			movd        ebx, mm1          ; 
			add         eax, ebx

			sar         eax, 14           ;  // 带符号右移14 bits
			jnc         NO_ROUNDING1      ; // 四舍五入到最近的整数
			inc         eax
NO_ROUNDING1:
            mov         s2, eax
			emms
			}
			tmp2[8*j+i] = s2;
		}
		else
		/* 下面采用的是浮点运算的方法*/
		{
			s = 0.0;
			for (k=0; k<8; k++)
				s += c[j][k] * block[8*i+k];
			tmp[8*i+j] = s;
		}
    }	for (j=0; j<8; j++)		for (i=0; i<8; i++)		{
			if (!doublePrecision)
			{
				s2 = 0;
				pC = (short*)c2 + (i*8);
				pTmp2 = tmp2 + (j*8);

				__asm
				{
				mov         eax, pTmp2        ;
				movq        mm0, [eax]        ; 
				movq        mm1, [eax+8]      ; 
				mov         eax, pC           ;
				movq        mm3, [eax]        ;
				movq        mm4, [eax+8]      ;
				pmaddwd     mm0, mm3          ;
				pmaddwd     mm1, mm4          ;

				movd        eax, mm0          ; 
				psrlq       mm0, 0x20         ;
				movd        ebx, mm0          ; 
				add         eax, ebx

				movd        ebx, mm1          ; 
				add         eax, ebx
				psrlq       mm1, 0x20         ;
				movd        ebx, mm1          ; 
				add         eax, ebx
				sar         eax, 14           ; 
				jnc         NO_ROUNDING2      ; 
				inc         eax
NO_ROUNDING2:
				mov         s2, eax
				emms
			}
			block[8*i+j] = s2;
		}
		else
		{
			s = 0.0;
			for (k=0; k<8; k++)
				s += c[i][k] * tmp[8*k+j];
			block[8*i+j] = (short)floor(s+0.499999);
		}
	}}
#pragma warning( default : 4244 )
⌨️ 快捷键说明

复制代码 Ctrl + C
搜索代码 Ctrl + F
全屏模式 F11
切换主题 Ctrl + Shift + D
显示快捷键 ?
增大字号 Ctrl + =
减小字号 Ctrl + -