📄 c6000软件优化经验总结(2).htm
字号:
type="application/x-shockwave-flash" width="774"
height="78"></embed></OBJECT></TD></TR></TBODY></TABLE>
<TABLE cellSpacing=0 cellPadding=0 width=776 align=center border=0>
<TBODY>
<TR>
<TD width="5%" height=30> <IMG
src="C6000软件优化经验总结(2).files/icon07.gif"></TD>
<TD>当前位置: 首页 >> <A
href="http://www.icembed.com/article.asp?ClassID=6"><FONT
color=#ff6600>设计心得</FONT></A> </TD></TR></TBODY></TABLE>
<TABLE cellSpacing=0 cellPadding=0 width=776 align=center border=0>
<TBODY>
<TR>
<TD vAlign=top width=600>
<TABLE
style="BORDER-RIGHT: #cccccc 1px solid; BORDER-TOP: #cccccc 1px solid; BORDER-LEFT: #cccccc 1px solid; BORDER-BOTTOM: #cccccc 1px solid"
cellSpacing=0 cellPadding=0 width="100%" border=0>
<TBODY>
<TR>
<TD>
<TABLE cellSpacing=0 cellPadding=0 width="100%" border=0>
<TBODY>
<TR>
<TD
style="FONT-WEIGHT: bold; FONT-SIZE: 16px; PADDING-BOTTOM: 10px; COLOR: #00287b; LINE-HEIGHT: normal; PADDING-TOP: 15px; FONT-STYLE: normal; FONT-VARIANT: normal"
align=middle height=25>C6000软件优化经验总结(2)</TD></TR>
<TR>
<TD class=hight1 bgColor=#cccccc> </TD></TR>
<TR>
<TD align=middle
height=30>作者:佚名 来源:本站原创 点击数:85 更新时间:2006-2-22 文章录入:admin</TD></TR></TBODY></TABLE></TD></TR>
<TR>
<TD class=hanju><BR>
<P>四、</P>
<P>1、源代码:</P>
<P>void fir_fxd1(short input[], short coefs[], short out[])</P>
<P>{</P>
<P> int i, j;</P>
<P> for (i = 0; i < 40; i++)</P>
<P> {</P>
<P> for (j = 0; j < 16; j++)</P>
<P>
out[i*16+j]= coefs[j] * input[i + 15 - j];</P>
<P> }</P>
<P>}</P>
<P>2、改编后的代码:</P>
<P>void fir_fxd2(const short input[], const short coefs[], short
out[])</P>
<P>{</P>
<P> int i, j;</P>
<P> </P>
<P> for (i = 0; i < 40; i++)</P>
<P> {</P>
<P> for (j = 0; j < 16; j++)</P>
<P>
out[i*16+j]= coefs[j] * input[i + 15 - j];</P>
<P> }</P>
<P> 3、优化方法说明:</P>
<P>C6000编译器如果确定两条指令是不相关的,则安排它们并行执行。
关键字const可以指定一个变量或者一个变量的存储单元保持不变。这有助于帮助编译器确定指令的不相关性。例如上例中,源代码不能并行执行,而结果改编后的代码可以并行执行。</P>
<P>4、技巧:</P>
<P>使用const可以限定目标,确定存在于循环迭代中的存储器的不相关性。</P>
<P>五、</P>
<P>1、源代码:</P>
<P>void vecsum(short *sum, short *in1, short *in2, unsigned int
N)</P>
<P>{</P>
<P> int i;</P>
<P> </P>
<P> for (i = 0; i < N; i++)</P>
<P> sum[i] = in1[i] +
in2[i];</P>
<P>}</P>
<P>2、改编后的代码:</P>
<P>void vecsum6(int *sum, const int *in1, const int *in2, unsigned
int N)</P>
<P>{</P>
<P> int i;</P>
<P> int sz = N >> 2;</P>
<P> </P>
<P> _nassert(N >= 20);</P>
<P> </P>
<P> for (i = 0; i < sz; i += 2)</P>
<P> {</P>
<P> sum[i] =
_add2(in1[i] , in2[i]);</P>
<P> sum[i+1] =
_add2(in1[i+1], in2[i+1]);</P>
<P> }</P>
<P>}</P>
<P>3、优化方法说明:</P>
<P>源代码中,函数变量的定义是 short *sum, short *in1, short *in2,
改编后的代码函数变量是 int *sum, const int *in1, const int *in2,
整数类型由16位改编成32位,这时使用内联指令“_add2”一次可以完成两组16位整数的加法,效率提高一倍。注意这里还使用了关键字const和内联指令_nassert优化源代码。</P>
<P>4、技巧:</P>
<P>用内联指令_add2、_mpyhl、_mpylh完成两组16位数的加法和乘法,效率比单纯16位数的加法和乘法提高一倍。</P>
<P>六、if...else...语句的优化</P>
<P>(一)</P>
<P>1、源代码:</P>
<P> if (sub (ltpg, LTP_GAIN_THR1) <= 0)</P>
<P> {</P>
<P> adapt =
0;
</P>
<P> }</P>
<P> else</P>
<P> { </P>
<P> if (sub (ltpg,
LTP_GAIN_THR2) <= 0)</P>
<P> {</P>
<P>
adapt =
1;
</P>
<P> }</P>
<P> else</P>
<P> {</P>
<P>
adapt =
2;
</P>
<P> }</P>
<P> }</P>
<P>2、改编后的代码:</P>
<P> adapt = (ltpg>LTP_GAIN_THR1) +
(ltpg>LTP_GAIN_THR2);</P>
<P>(二)</P>
<P>1、源代码:</P>
<P> if (adapt == 0)</P>
<P> {</P>
<P> if (filt>5443) </P>
<P> {</P>
<P>
result = 0;</P>
<P> }</P>
<P> else</P>
<P> {</P>
<P>
if (filt < 0)</P>
<P>
{</P>
<P>
result = 16384; </P>
<P>
}</P>
<P>
else</P>
<P>
{ </P>
<P>
filt = _sshl (filt, 18)>>16; // Q15 </P>
<P>
result = _ssub (16384, _smpy(24660, filt)>>16);</P>
<P>
}</P>
<P> }</P>
<P> }</P>
<P> else</P>
<P> {</P>
<P> result = 0;</P>
<P> }</P>
<P>2、改编后的代码:</P>
<P> filt1 = _sshl (filt, 18)>>16; </P>
<P> tmp = _smpy(24660, filt1)>>16;</P>
<P> result = _ssub(16384, tmp * (filt>=0));
</P>
<P> result = result *
(!((adapt!=0)||(filt>5443)));</P>
<P>(三) </P>
<P>1、源代码: </P>
<P>static Word16 saturate(Word32 L_var1)</P>
<P>{</P>
<P> Word16 swOut;</P>
<P> </P>
<P> if (L_var1 > SW_MAX)</P>
<P> {</P>
<P> swOut = SW_MAX;</P>
<P> giOverflow = 1;</P>
<P> }</P>
<P> else if (L_var1 < SW_MIN)</P>
<P> {</P>
<P> swOut = SW_MIN;</P>
<P> giOverflow = 1;</P>
<P> }</P>
<P> else</P>
<P> swOut = (Word16) L_var1; /* automatic type
conversion */</P>
<P> return (swOut);</P>
<P>}</P>
<P>2、改编后的代码:</P>
<P>static inline Word32 L_shl(Word32 a,Word16 b)
</P>
<P>{</P>
<P>return ((Word32)((b) < 0 ? (Word32)(a) >> (-(b)) :
_sshl((a),(b)))) ;</P>
<P>}</P>
<P>3、优化方法说明:</P>
<P>如果在循环中出现if...else...语句,由于if...else...语句中有跳转指令,而每个跳转指令有5个延迟间隙,因此程序执行时间延长;另外,循环内跳转也使软件流水受到阻塞。直接使用逻辑判断语句可以去除不必要的跳转。例如在例1的源代码最多有两次跳转,而改编后不存在跳转。例2
和例3同样也去掉了跳转。</P>
<P>4、技巧:</P>
<P>尽可能地用逻辑判断语句替代if...else...语句,减少跳转语句。</P>
<P>七、</P>
<P>1、源程序</P>
<P> dm = 0x7FFF;</P>
<P> for (j = 0; j < nsiz[m]; j = add(j, 1))</P>
<P> {</P>
<P> if (d[j] <= dm)</P>
<P> {</P>
<P> dm = d[j];</P>
<P> jj = j;</P>
<P> }</P>
<P> }</P>
<P> index[m] = jj;</P>
<P>2、优化后的程序</P>
⌨️ 快捷键说明
复制代码
Ctrl + C
搜索代码
Ctrl + F
全屏模式
F11
切换主题
Ctrl + Shift + D
显示快捷键
?
增大字号
Ctrl + =
减小字号
Ctrl + -