tri_idct.c

来自「用MPEG-4对YUV视频文件编码压缩成divx视频文件」· C语言代码 · 共 245 行
245 行
/*
 * Copyright (c) 1995,2000 TriMedia Technologies Inc.
 *
 * +------------------------------------------------------------------+
 * | This software is furnished under a license and may only be used  |
 * | and copied in accordance with the terms and conditions of  such  |
 * | a license and with the inclusion of this copyright notice. This  |
 * | software or any other copies of this software may not be provided|
 * | or otherwise made available to any other person.  The ownership  |
 * | and title of this software is not transferred.                   |
 * |                                                                  |
 * | The information in this software is subject  to change without   |
 * | any  prior notice and should not be construed as a commitment by |
 * | TriMedia Technologies.                                           |
 * |                                                                  |
 * | this code and information is provided "as is" without any        |
 * | warranty of any kind, either expressed or implied, including but |
 * | not limited to the implied warranties of merchantability and/or  |
 * | fitness for any particular purpose.                              |
 * +------------------------------------------------------------------+
 *
 *  Module name              : fast_idct.c    2.0
 *
 *  Last update              : 15:00:00 - 2000/05/12
 *
 *  Description              :
 *
 *  IDCT example program:
 *  This program has been adapted from the Trimedia MPEG2 video decoder.
 */              
 
#include "../user_macro.h"
#ifdef _TRIMEDIA
 
#include <stdio.h>
#include	"coeffs_i.h"	/* new scaled up coefficients */
#include "idct.h"
/*
#include "debug/debug.h"
#include "ops/custom_defs.h"
*/
/************************************************************************/
/* Compilation switches allowing to test various IDCT configurations	*/
/************************************************************************/

#define	SCALED_COEFFS		1	/* 0 or 1 */
#define	EIGHT_BIT_SAMPLES	0	/* 0 or 1 */
#define PASS1_BITS	 	1+(EIGHT_BIT_SAMPLES)		/* 2 or 1 */
#define	CONST_BITS2		14
#define	TMP_20_21_H_BIAS	0x8000	/* bias for rounding by right shift */
#define H_ROUNDING		(32 << (16*!LITTLE_ENDIAN))


#define	UPSCL	3		/* upscale by 8 (2^3) */
#define DWNSCL 	CONST_BITS2+PASS1_BITS+SCALED_COEFFS+3-16
				/* downscale factor */

#if	defined(__LITTLE_ENDIAN__)
#define PACK16_MSB(a, b)       PACK16MSB(b, a)
#define PACK16_LSB(a, b)       PACK16LSB(b, a)
#else
#define PACK16_MSB(a, b)       PACK16MSB(a, b)
#define PACK16_LSB(a, b)       PACK16LSB(a, b)
#endif

#if	!defined(HOSTED)
#include "ops/custom_defs.h"	/* Simulation of Trimedia custom operators */
custom_op long			dualasr(long a, unsigned long b);
custom_op long			dualiclipi(long a, unsigned long b);
#define	pack16_msb(a, b)	PACK16_MSB(a, b)
#else
#define	restrict
#define	pack16_msb(a, b)	PACK16_MSB(b, a)
#endif

#define combinePred(dct0, dct1, dct2, dct3, pred1, pred2)		    \
	pred1 = dualiclipi(dualasr(pack16_msb(dct0, dct1), DWNSCL), clip);  \
	pred2 = dualiclipi(dualasr(pack16_msb(dct2, dct3), DWNSCL), clip);  \


#define	horiz_idct(data, offset, r0, r1, r2, r3, r4, r5, r6, r7, comp)   \
 									 \
 		z0 = PACK16_LSB(data[offset+ 0] << UPSCL, data[offset+32] << UPSCL) ; \
		z2 = PACK16_LSB(data[offset+ 8] << UPSCL, data[offset+40] << UPSCL) ; \
		z5 = PACK16_LSB(data[offset+16] << UPSCL, data[offset+48] << UPSCL) ; \
		z3 = PACK16_LSB(data[offset+24] << UPSCL, data[offset+56] << UPSCL) ; \
 		zz0 = PACK16_LSB(data[offset+ 4] << UPSCL,data[offset+36] << UPSCL) ; \
		zz2 = PACK16_LSB(data[offset+12] << UPSCL,data[offset+44] << UPSCL) ; \
		zz5 = PACK16_LSB(data[offset+20] << UPSCL,data[offset+52] << UPSCL) ; \
		zz3 = PACK16_LSB(data[offset+28] << UPSCL,data[offset+60] << UPSCL) ; \
 									 \
		tmp22 = IFIR16(z5, MASK1); 				 \
		tmp23 = IFIR16(z5, MASK2); 				 \
		tmp20 = IFIR16(z0, MASK3) + TMP_20_21_H_BIAS;		 \
		tmp21 = IFIR16(z0, MASK4) + TMP_20_21_H_BIAS;		 \
 									 \
		tmp10 = tmp20 + tmp23; 					 \
		tmp13 = tmp20 - tmp23; 					 \
		tmp11 = tmp21 + tmp22; 					 \
		tmp12 = tmp21 - tmp22; 					 \
 									 \
		tmp0 = IFIR16(z2, D0) + IFIR16(z3, D1); 		 \
		tmp1 = IFIR16(z2, D2) + IFIR16(z3, D3); 		 \
		tmp2 = IFIR16(z2, D4) + IFIR16(z3, D5); 		 \
		tmp3 = IFIR16(z2, D6) + IFIR16(z3, D7); 		 \
 									 \
		temp22 = IFIR16(zz5, MASK1); 				 \
		temp23 = IFIR16(zz5, MASK2); 				 \
		temp20 = IFIR16(zz0, MASK3) + TMP_20_21_H_BIAS;		 \
		temp21 = IFIR16(zz0, MASK4) + TMP_20_21_H_BIAS;		 \
 									 \
		temp10 = temp20 + temp23; 				 \
		temp13 = temp20 - temp23; 				 \
		temp11 = temp21 + temp22; 				 \
		temp12 = temp21 - temp22; 				 \
 									 \
 									 \
		temp0 = IFIR16(zz2, D0) + IFIR16(zz3, D1); 		 \
		temp1 = IFIR16(zz2, D2) + IFIR16(zz3, D3); 		 \
		temp2 = IFIR16(zz2, D4) + IFIR16(zz3, D5); 		 \
		temp3 = IFIR16(zz2, D6) + IFIR16(zz3, D7); 		 \
 									 \
 									 \
		r0 =  PACK16_MSB(tmp10 + tmp3, temp10 + temp3);		 \
		r1 =  PACK16_MSB(tmp11 + tmp2, temp11 + temp2);		 \
		r2 =  PACK16_MSB(tmp12 + tmp1, temp12 + temp1);		 \
		r3 =  PACK16_MSB(tmp13 + tmp0, temp13 + temp0);		 \
		r4 =  PACK16_MSB(tmp13 - tmp0, temp13 - temp0);		 \
		r5 =  PACK16_MSB(tmp12 - tmp1, temp12 - temp1);		 \
		r6 =  PACK16_MSB(tmp11 - tmp2, temp11 - temp2);		 \
		r7 =  PACK16_MSB(tmp10 - tmp3, temp10 - temp3);		 \
		/* horiz_idct_clear(data, offset) ;	*/

#ifdef	ONEPASS
#define vertical_idct(r0, r1, r2, r3, dest1, dest2, dest3, dest4)        \
	dest1 = r0;							 \
	dest2 = r1;							 \
	dest3 = r2;							 \
	dest4 = r3;

#else

#define vertical_idct(r0, r1, r2, r3, dest1, dest2, dest3, dest4)        \
 									 \
	tmp22 = IFIR16(r2, MASK1); 					 \
	tmp23 = IFIR16(r2, MASK2); 					 \
	tmp20 = IFIR16(r0, MASK3); 					 \
	tmp21 = IFIR16(r0, MASK4); 					 \
 									 \
	tmp10 = tmp20 + tmp23; 						 \
	tmp13 = tmp20 - tmp23; 						 \
	tmp11 = tmp21 + tmp22; 						 \
	tmp12 = tmp21 - tmp22; 						 \
 									 \
	tmp0 = IFIR16(r1, D0) + IFIR16(r3, D1); 			 \
	tmp1 = IFIR16(r1, D2) + IFIR16(r3, D3); 			 \
	tmp2 = IFIR16(r1, D4) + IFIR16(r3, D5); 			 \
	tmp3 = IFIR16(r1, D6) + IFIR16(r3, D7); 			 \
									 \
	combinePred(tmp10 + tmp3 + rd, tmp11 + tmp2 + rd, tmp12 + tmp1 + rd,	 \
		     tmp13 + tmp0 + rd, dest1, dest2)			 \
        combinePred(tmp13 - tmp0 + rd, tmp12 - tmp1 + rd, tmp11 - tmp2 + rd, 	 \
		    tmp10 - tmp3 + rd, dest3, dest4 ) ;

#endif

/* function pointer */
idctFuncPtr  idct;


void
original_idct8x8fix(short * restrict datain, short * restrict sdataout, int clip)
{
  int	r00, r01, r02, r03;
  int	r10, r11, r12, r13;
  int	r20, r21, r22, r23;
  int	r30, r31, r32, r33;
  int	r40, r41, r42, r43;
  int	r50, r51, r52, r53;
  int	r60, r61, r62, r63;
  int	r70, r71, r72, r73;

  int tmp0, tmp1, tmp2, tmp3;
  int tmp10, tmp11, tmp12, tmp13;
  int tmp20, tmp21, tmp22, tmp23;
  int temp0, temp1, temp2, temp3;
  int temp10, temp11, temp12, temp13;
  int temp20, temp21, temp22, temp23;

  int z0, z2, z3, z5;
  int zz0, zz2, zz3, zz5;
  long * restrict dataout;
  int rd;		/* rounding factor (0.5). Algorithm uses shift and round */

  /*DEBUG_FUNCTION(TRI_IDCT_ORIGINAL_IDCT8X8FIX);*/
#pragma TCS_no_caller_save

  rd = 1 << (DWNSCL + 15);	/* 0.5 in Q.16 format */
  dataout = (long *)sdataout;

#ifdef DEBUG_COL_1
  printf("%d %d %d %d %d %d %d %d\n",
	 datain[0], datain[8], datain[16], datain[24],
	 datain[32], datain[40], datain[48], datain[56]);
#endif

      horiz_idct(datain, 0, r00, r01, r02, r03, r40, r41, r42, r43, H_ROUNDING);

#ifdef	DEBUG_COL_1
      printf("%08x %08x %08x %08x %08x %08x %08x %08x\n",
	     r00, r01, r02, r03, r40, r41, r42, r43);
#endif

      horiz_idct(datain, 1, r10, r11, r12, r13, r50, r51, r52, r53, 0);
      horiz_idct(datain, 2, r20, r21, r22, r23, r60, r61, r62, r63, 0);
      horiz_idct(datain, 3, r30, r31, r32, r33, r70, r71, r72, r73,0);

      /* Pass 2: process columns. */
      /* Note that we must descale the results by a factor of 8 == 2**3, */
      /* and also undo the PASS1_BITS scaling. */

      vertical_idct(r00, r10, r20, r30, dataout[0], dataout[1], dataout[2], dataout[3]);
      vertical_idct(r01, r11, r21, r31, dataout[4], dataout[5], dataout[6], dataout[7]);
      vertical_idct(r02, r12, r22, r32, dataout[8], dataout[9], dataout[10], dataout[11]);
      vertical_idct(r03, r13, r23, r33, dataout[12], dataout[13], dataout[14], dataout[15]);
      vertical_idct(r40, r50, r60, r70, dataout[16], dataout[17], dataout[18], dataout[19]);
      vertical_idct(r41, r51, r61, r71, dataout[20], dataout[21], dataout[22], dataout[23]);
      vertical_idct(r42, r52, r62, r72, dataout[24], dataout[25], dataout[26], dataout[27]);
      vertical_idct(r43, r53, r63, r73, dataout[28], dataout[29], dataout[30], dataout[31]);
  /*DEBUG_FUNCTION_END();*/
}


void
idct8x8fix(short * block)
{
	/*DEBUG_FUNCTION(TRI_IDCT_IDCT8X8FIX);*/
	original_idct8x8fix(block, block, 1000);
	/*DEBUG_FUNCTION_END();*/
}
#endif
tri_idct.c - 源码说明

本页面展示了「用MPEG-4对YUV视频文件编码压缩成divx视频文件」中的 tri_idct.c 源码文件，采用 C语言编程语言编写，共 245 行代码。您可以在线阅读完整代码内容，也可以返回资源详情页下载完整源码包进行本地学习和开发。
虫虫下载站收录了大量与MPEG相关的技术资源，包括源代码、技术文档、电路图等，是电子工程师和嵌入式开发者的专业学习平台。
⌨️ 快捷键说明

复制代码Ctrl + C
搜索代码Ctrl + F
全屏模式F11
增大字号Ctrl + =
减小字号Ctrl + -
显示快捷键?