📄 ti c54xx dsp 十天速成讲义 六 七八.txt
字号:
TI C54xx DSP 十天速成讲义 <六> <七><八>TI C54xx DSP 十天速成讲义 <六>
实验六 DMA实验
实验目的:学习DMA的原理的使用方法
实验内容:用DMA方法接收McBSP接口语音芯片的数据
DMA是直接存储器存取,是一种传送不占用CPU处理时间的大批量数据传送的有效方式。我们用以下实例来说明它的应用:
如果我们要做一个音频处理系统,需要连续用McBSP接口的语音芯片采集若干个样本进行处理,比如频谱分析、音频压缩等。本例假设要每采集256个样本进行一次处理。上例用的是查询方式,占用了所有CPU资源。可以用中断方式,结合前面的实验不难做到,请同学们自行完成。在这个实验中我们将介绍一个更有效的DMA传送方式。我们比较一下用中断方式和DMA方式的效率有何不同:
一、中断方式:每当中缓冲串口接收一个16bit样本的数据,触发一次串口接收中断,将数据转移到一个256
word的数据接收缓冲区并计数。当计数达到256个,即缓冲区满时,将256个数据转移到数据处理存储区,并通知主程序进行处理。
二、DMA方式:我们使用一个通道自动接收McBSP传来的数据并存入接收缓冲区,当缓冲区满时触发DMA中断,将256个数据传送到数据处理存储区,传送完毕触发通知主程序进行处理。
由上比较可见,每接收一批样本,用中断方式将触发256次中断,也就是主程被打断256次去接收数据。而用DMA方式,只在全部256个样本全部接收完毕时发生一次中断,这时主程序应该已经处理完上一批的数据。
进一步考虑,当数据处理完毕后还需要将数据送走,这时又可以采用另一个DMA通道完成这个任务,将CPU释放出来等待进行下一批样本的处理。
事实上DMA传送并非比用CPU直接处理快,例如在内部存贮器之间传送时,用CPU需要2cycle/word,而用DMA要4cycle/word。DMA的优势在是把CPU解放出来做其它的事。
以下是两个DMA通道与CPU协调工作的情况(阴影部分表示空闲)。
DMA0①①①
CPU②③ ②③ ②
DMA1 ④ ④
①从McBSP接收数据
②DMA中断,将数据从接收缓冲区转移到数据处理存储区
③对对数据进行处理
④将处理完的数据送走
估计一下各步的时间,设采样频率是8kHz,CPU时钟频率100MHz。因此一个处理周期为1/8kHz*256=32ms。
②传送256个点至少需要256word*2cycle/word=512cycle=5.12us。
假设处理完后数据量不变,④需要256word*4cycle/word=1024 cycle=10.24us。
③所需要的时钟周期取决于算法的复杂度了。
计算好各步所需要的时钟周期,就可以根据情况灵活选择如何使用DMA,例如如果CPU有足够的空闲时间送走数据就不必要④;如果CPU仍然不足,就需要再增加个一个DMA来做②的任务。如果数据的输出也是从McBSP输出,还要用一个DMA通道进行McBSP的发送。
总之要合适地使用DMA通道,使用不当也会使程序变得更加复杂,例如多个DMA通道优先级的问题等等。
C54x系列有6个DMA通道,但不同型号C54x系列DSP
DMA通道的使用不全相同,如C5402只能将DMA通道用于内部数据存贮器之间传送、McBSP和HPI接口,而C5410可用于内部、外部数据、程序存贮器之间传送。详细介绍请参阅SPRU302
TMS320C54x DSP Reference Set, Volume 5: Enhanced
Peripherals和各DSP的数据手册。
TI C54xx DSP 十天速成讲义 <七>
实验7.1 FIR
;=============================================================
; fir4.asm
;用用循环缓冲区和双操作数寻址方法实现FIR滤波器
;先用matlab,选择80点汉明窗设计一个截止频率为0.2π的低通滤波器
; 本例与前不同的是系数直接引用程序存储器的系数表
;N=5 y(n)=h0*x(n)+h1*x(n-1)+h2*x(n-2)+h3*x(n-3)+h4*x(n-4)
;=============================================================
.title "fir4.asm"
.mmregs
.def start
;分配数据存储区
.bss y,1 ;y
xn .usect "xn",80 ;xn
h .usect "h",80 ;h
PA0 .set 0000H ;数据输出端口
PA1 .set 0001H ;数据输入端口
;参数表
.data
table: .word -7,-18,-24,-22,-9,11,33,48
;已在Matlab中转成十六进制的小数
.word 46,20,-24,-73,-104,-97,-43,49
.word 146,204,187,81,-91,-268,-371,-337
.word -144,162,476,661,603,261,-297,-894
.word -1283,-1222,-562,697,2373,4142,5618,6456
.word 6456,5618,4142,2373,697,-562,-1222,-1283
.word -894,-297,261,603,661,476,162,-144
.word -337,-371,-268,-91,81,187,204,146
.word 49,-43,-97,-104,-73,-24,20,46
.word 48,33,11,-9,-22,-24,-18,-7
start: SSBX FRCT ;小数乘法
;把参数表复制到数据存储区
STM #h,AR1
RPT #79
MVPD #table,*AR1+
;把x(n)-x(n-79)赋始值0
STM #xn,AR1
RPT #79
ST #0,*AR1+
STM #xn+79,AR3 ;x(n-79)---AR3
STM #h+79,AR4 ;h(n-79)---AR4
STM #80,BK ;循环缓冲区大小80
STM #-1,AR0 ;指针调整值-1
LD #xn,DP ;DP指向xn所在页
PORTR PA1,@xn ;输入数据
LD #y,DP ;DP指向y所在页
FIR: RPTZ A,#79 ;进行一次FIR运算
MAC *AR3+0%,*AR4+0%,A;A=(AR3)*(AR4)+A,
AR3=AR3+AR0,AR4=AR4+AR0
STH A,@y ;保存计算结果
PORTW @y,PA0 ;输出结果
BD FIR ;读入下一个数据并进行下一次计算
PORTR PA1,*AR3+0% ;新数据覆盖了最旧的数据
.end
实验7.2 IIR
.mmregs
.global codestart
K_DATA_SIZE .set 256 ;输入数据个数
K_BUFFER_SIZE .set 8 ;缓冲大小,需是2的整数次幂,并大于a、b的个数
K_STACK_SIZE .set 256 ;堆栈大小
K_A .set 3 ;a向量个数
K_B .set 4 ;b向量的个数
K_CIR .set 4 ;>=a、b的长度,也可以设为K_BUFFER_SIZE-1
STACK .usect "stack",K_STACK_SIZE
SYSTEM_STACK .set K_STACK_SIZE+STACK
.data
DATA_DP:
.align K_BUFFER_SIZE
bufferdatax: .space K_BUFFER_SIZE*16 ;size in bits
bufferdatay: .space K_BUFFER_SIZE*16 ;size in bits
inputdata: .word 0
filterdata: .word 0
.text
.asg AR2, ORIGIN
.asg AR3, INPUT
.asg AR4, FILTER
.asg AR5, OUTPUT
codestart:
SSBX FRCT
SSBX INTM
LD #DATA_DP,DP
STM #SYSTEM_STACK, SP
CALL filter_start
NOP
NOP
NOP
LOOP:
B LOOP
.def b0,b1,b2,b3,a1,a2,a3;
.def filter_start
b0 .set 1456H ;b1=0.1589 *2^15
b1 .set 3D07H ;b2=0.4768
b2 .set 3D07H ;b3=0.4768
b3 .set 1456H ;b4=0.1589
a1 .set -103AH ;a1=-0.1268
a2 .set 430FH ;a2=0.5239
a3 .set -1016H ;a3=-0.1257
;=================================================================
;滤波子程序:filter_start
;=================================================================
.text
filter_start:
STM #K_CIR,BK ;设置环形buffer的大小
STM #1,AR0 ;和步长
STM #inputdata,ORIGIN ;AR2
STM #bufferdatax,INPUT ;AR3
STM #bufferdatay,FILTER ;AR4
STM #filterdata,OUTPUT ;AR5
;初始化
RPT #K_B-1-1 ;
ST #0,*INPUT+0% ;x(-1)、x(-2)、x(-3)设为0
RPT #K_A-1
ST 0,*FILTER+% ;y(-1)、y(-2)、y(-3)设为0
STM #bufferdatay,FILTER
STM #K_DATA_SIZE-1,BRC ;块循环次数,头三个值已经直接通过了
RPTB filter_end-1 ;块循环结束位置
;可以把块循环改成中断调用,有新数据就中断一次。
nop ;数据从件导入点,加nop保证数据在使用前导入
nop
MVDD *ORIGIN,*INPUT ;新数据
MAR *+INPUT(-K_B+1)%
MPY *INPUT+0%,#b3,B ;B=x(n-3)*b3, i=i+1
LD B,A
MPY *INPUT+0%,#b2,B ;B=x(n-2)*b2, i=i+1
ADD B,A
MPY *INPUT+0%,#b1,B ;B=x(n-1)*b1, i=i+1
ADD B,A
MPY *INPUT+0%,#b0,B ;B=x(n)*b0, i=i+1
ADD B,A
MPY *FILTER+0%,#a3,B ;B=y(n-3)*a3, j=j+1 j=n-3为y的指针
ADD B,A
MPY *FILTER+0%,#a2,B ;B=y(n-2)*a2, j=j+1
ADD B,A
MPY *FILTER+0%,#a1,B ;B=y(n-1)*a1, j=j+1
ADD B,A
STH A,*FILTER ;传送y(n)至y区, ;16位小数相乘得到的是32位小数
STH A,*OUTPUT ;传送y(n)至结果区 ;取前16位就行了
MAR *+FILTER(-K_A+1)%
nop
nop ;数据文件导出点,加nop保证数据在导出前已更新
filter_end: NOP ;循环结束
RET
.end
TI C54xx DSP 十天速成讲义 <八>
实验八 程序加载
C5000 DSP没有内部提供掉电保存程序的ROM/EPROM/Flash,上电时需要从外部加载应用程序。C5000
DSP提供了多种程序加载方式,满足不同应用的需要:串行加载、并行加载、HPI加载等,实际应用最多的是并行加载,本实验主要介绍8位并行存贮器加载。
加载过程:DSP上电时,如果MP/MC引脚为低电平,则跳转到内部ROM的FF80中断向量表的Reset中断,该处有一个跳转指令转到称为Bootloader的加载程序执行,该程序的功能是按照一定顺序查找可用的加载方式,如果找到,则开始加载应用程序,加载完毕转向应用程序执行。
实现并行存贮器加载的关键是建立一个加载表(boot
table),该表包括:一个或多个程序代码段、部分需要初始化的寄存器值、程序入口等信息。CCS附带有一个应用程序(C5000系列是hex500.exx)可以把.out程序转成.hex格式的加载表,然后可以烧录到非易失性存贮器中,如OTP/EPPOM/EEPROM/Flash中。
具体步骤:
1.修改项目的编译选顶,使其生成可以转化成加载表的.out文件格式
2.为hex500.exe建立一个配置文件
3.用hex500.exe把*.out转化成加载表*.hex
4.在.hex未尾加上加载表起始地址
5.烧录到非易失性存贮器中
6.安到目标板上进行加载实验
各步骤详述如下:
1.修改项目的编译选顶,使其生成可以转化成加载表的.out文件格式
在Project/Build Option…/Complier 里面加一个选项:-v548,或在Basic/Process
verson一栏中填写:548,然后点确定。
注意:如果不加这个选项,用hex500程序转化出来的hex文件无法加载。
2.为hex500.exe建立一个配置文件
这个配置文件包含了hex500程序执行所需要的选顶,下面是一个样板配置文件hex.cmd:
sample.out /* 待转化的程序文件*/
-map hex.map /* 生成一个map文件便于查看转化结果*/
-o hex.hex /* 输出文件名*/
-i /* 输出文件为Intel Hex 文件格式 */
-memwidth 8 /* 目标系统的存贮器为8位*/
-romwidth 8 /* 存贮器芯片的位宽为8位*/
-boot /* 生成加载表*/
-bootorg 0000h /* 加载表在存贮芯片中的起始位置*/
-e 80h /* 程序入口,即加载完毕后跳转执行程序位置 */
初学者容易弄错的是memwidth、romwidth和bootorg这三个选项。不同存贮器配置下设置不同,并且要注意的是上文注释的(包括TI资料中的解释)是程序脱机烧写的设置,而在系统烧录(EEPROM、Flash、NVSRAM可以支持)与脱机烧写又会有所不同。
脱机烧写指的是将存贮芯片放置在编程器里烧写,优点是直接可以利用hex500转化出来的hex文件,缺点是普通编程器无法烧写贴片封装的芯片。
在系统烧写相对灵活,但对不同系统,不同芯片需要编写专用的烧录程序,并且需要将hex文件进一步进行格式转换成烧录程序可以识别的程序。
不同情况设置方法如下表:
存贮器配置方案脱机烧写在系统烧写
8位存贮器-memwidth 8
-romwidth 8
16位存贮器-memwidth 16
-romwidth 16
两片8位贮器并行组成16位存贮器-memwidth 16
-romwidth 8-memwidth 16
-romwidth 16
bootorg芯片中的起始地址系统中的起始地址
3.用hex500.exe把*.out转化成加载表*.hex
在dos窗口下执行:hex500 hex.cmd
如果hex500.exe与hex.cmd以及待转化的程序文件不在同一目录下,需加上路径或设置path环境变量。
4.在FFFFH加上加载表起始地址
当开始并行加载时,Bootloader程序会在外部程序空间的FFFFH(如果是8位系统,同时也会查FFFEH)寻找加载表的地址,如果熟悉hex文件格式可以直接在hex文件末尾加一条纪录,也可以烧录器软件中加。
应用实例:
本实验箱是用于程序加载的是8位EPROM或EEPROM,可以用脱机方式,如用EEPROM也可以用在系统方式。Hex500程序的配置文件如前hex.cmd文件,只需要把第一行的sample.out换成实际的程序名称。EPROM/EEPROM在程序空间的地址为8000H,并且由于是8位系统,则要在FFFEH和FFFFH的值分别设为80H、00H。可以在生成的.hex文件倒数第二行加上:
:027FFE00800001
也可以在烧录器软件中修改FFFEH-FFFFH处的值,然后就可以烧写了。
烧写好后,将芯片安置在IC座中,确认MP/MC跳线置为低电平,INT3、INT2的跳线置于悬空后,打开电源,就可以看到程序运行的状况。
⌨️ 快捷键说明
复制代码
Ctrl + C
搜索代码
Ctrl + F
全屏模式
F11
切换主题
Ctrl + Shift + D
显示快捷键
?
增大字号
Ctrl + =
减小字号
Ctrl + -