本文研究的视频处理系统是上海市科委技术攻关基金项目“计算机视觉及其芯片化实现”的一部分,主要完成计算机视觉系统的一些基本工作,即视频图像的采集、预处理和显示等。 视频图像采集和预处理系统以Xilinx公司Virtex-ⅡPro系列的FPGA为核心控制器件,结合视频模数转换芯片和VGA显示器,完成视频图像的实时采集、预处理和显示。采集和显示部分作为同外界交流信息的渠道,是构成计算机视觉系统必不可少的一部分;图像预处理则是计算机视觉系统进行高层处理的基础,优秀的预处理算法能有效改善图像质量,提高系统分析判断的准确性。 本文在介绍基于FPGA的视频采集、预处理系统整体架构的基础上,围绕以下四个方面展开了工作: 1.研究并给出了两种基于FPGA的设计方案用于实现YCrCb色度空间到RGB色度空间的转换; 2.针对采集的视频图像,根据VGA显示的要求,给出了一种实现图像去隔行的方案; 3.分析了一系列图像滤波的预处理算法,如均值滤波、中值滤波和自适应滤波等,在比较和总结各算法特点的基础上,提出了一种新的适用于处理混合噪声的滤波算法:混合自适应滤波法; 4.根据算法特点设计了多种采用FPGA实现的图像滤波算法,并对硬件算法进行RTL级的功能仿真和验证,还给出了各种滤波算法的实验结果,在此基础上对各种算法的效果进行直观的比较。 文中,预处理算法的实现充分利用了FPGA的片内资源,体现了FPGA在图像处理方面的特点及优势。同时,视频采集和显示的控制模块也由同一FPGA芯片实现,从而简化了系统整体结构。视频采集和预处理系统在FPGA上的成功实现为“计算机视觉及其芯片化实现”奠定了必要的基础、提供了一定理论依据。
上传时间: 2013-04-24
上传用户:我好难过
H.264视频编解码标准以其高压缩比、高图像质量、良好的网络适应性等优点在数字电视广播、网络视频流媒体传输、视频实时通信等许多方面得到了广泛应用。提高H.264帧内预测的速度,对于实时性要求较高的场合具有重大的意义。为此,论文在总结国内外相关研究的基础上,针对H.264帧内预测的软件实现具有运算量大、实时性差等缺点,提出了一种基于FPGA的高并行、多流水线结构的帧内预测算法的硬件实现。 论文在详细阐述H.264帧内预测编码技术的基础上,分析了17种预测模式算法,通过Matlab仿真建模,直观地给出了预测模式的预测效果,并在JM12.2官方验证平台上测试比较各种预测模式对编码性能的影响,以此为根据对帧内预测模式进行裁剪。接着论文提出了基于FPGA的帧内预测系统的设计方案,将前段采集剑的RGB图像通过色度转换模块转换成YCbCr图像,存入片外SDRAM中,控制模块负责读写数掘送入帧内预测模块进行处理。帧内预测模块中,采用一种并行结构的可配置处理单元,即先求和再移位最后限幅的电路结构,来计算各预测模式下的预测值,极大地减小了预测电路的复杂度。针对预测模式选择算法,论文采用多模式并行运算的方法,即多个结构相同的残差计算模块,同时计算各种预测模式对应的SATD值,充分发挥FPGA高速并行处理的能力。其中Hadamard变换使用行列分离的变换方法,采用蝶形快速变换、流水线设计提高硬件的工作效率。最后,论文设计了LCD显示模块直观地显示所得到的最佳预测模式。 整个帧内预测系统被划分成多个功能模块,采用层次化、模块化的设计思想,并采用流水线结构和乒乓操作来提高系统的并行性、运行速度和总线利用率。所有模块用Verilog语言设计,由Modelsim仿真和集成开发环境ISE9.1综合。仿真与综合结果表明,系统时钟频率最高达到106.7MHz。该设计在完成功能的基础上,能够较好地满足实时性要求。论文对于研究基于FPGA的H.264视频压缩编码系统进行了有益的探索,具有一定的实用价值。
上传时间: 2013-07-21
上传用户:ABCD_ABCD
OM8361/TDA8362单片机的设计及应用 OM8361/TDA8362为飞利浦公司开发的单片集成电路来完成全部小信号的处理OM8361/TDA8362集成度较高可完成中频视频色度及行场扫描等小信号的处理具有PAL/NTSC自动识别彩色解码电路若外接TDA8395即可方便实现SECAM解码集成块外接了免调整的一行基带延时处理专用芯片TDA4665由于色解码方面采用了当今流行的PAL-S方式的色解码方式使得PAL制图像的色彩亮丽鲜艳程度有了极大的提高块内还集成了色度陷波器色带通滤波器亮度延迟线等使外围可调元件较少方便了生产与维修
上传时间: 2013-10-08
上传用户:qiao8960
在深入的对频谱脸法和Fisherface方法进行研究后,综合这两种方法的优点,提出了一种基于频谱脸和Fisherface的人脸识别新方法。频谱脸方法主要是采用二维小波变换和傅立叶变换。因为人脸图像的低频部分对人脸的表情变化是不敏感的,所以对人脸图像使用二维小波变换,提取人脸图像的低频部分。对人脸图像的低频部分使用傅立叶变换,从而获得原人像的一个低维空间的表达。但是频谱脸特征维数仍然较高,所以在频谱脸法的基础上继续提取人脸频谱图像的Fisherface 特征,降低特征的维数,提高识别效率。利用人脸面部构造产生的灰度特性提取眼睛,利用嘴唇的色度特征分割出嘴巴,进而根据眼睛和嘴巴构成三角形模板的特性,精确定位人脸在图像中的位置。实验结果表明,这种结合肤色和面部特征的算法,能够对人脸进行较快速、准确的定位,而且结果比较稳定可靠。
上传时间: 2013-10-09
上传用户:zhf01y
程序代码说明:对癌细胞颜色进行分析,和正常细胞相比,癌细胞的核颜色较深,色彩分量有较大的差异。据此,对癌细胞进行色度学分类识别。
上传时间: 2015-03-22
上传用户:hongmo
本文完成了对唇动身份识别技术几个基本问题的理论研究,并对整个系统加以实现.作为本文研究的实验基础,我们建立了唇动方式身份识别数据库(HITLUDB), 该库目前包含30个说话人每人20个汉语词的音视频语料.数据库的扩充与完善工作仍在不断的进行之中.在嘴唇检测方面, 我们对自适应色度过滤模型进行改进,提高了算法的鲁棒性,完成了对嘴唇的精确定位.结合DCT变换与K-L变换的各自特点, 我们提出了特征提取算法,使用较少维数的特征完成了对嘴唇区域主要信息的刻画.由于唇动信息同时包含了生理特征与行为特征, 我们使用静念动念混合建模的方式,完成了对说话人唇动个性特点的精确描述.在HMM训练时,我们提出了特征的归一化处理方法,提高了HMM在实际应用中的性能. 最后,我们分别对身份辨认系统与身份确认系统的基本理论进行了叙述,并完成了系统的实践工作. 关 键 词:身份识别 唇动 特征提取 隐马尔可夫模型 K-L变换
上传时间: 2014-01-14
上传用户:wsf950131
用matlab模拟全电视信号,包括场、行消隐脉冲,亮度信号,色度信号,色同步信号
上传时间: 2014-01-12
上传用户:wangzhen1990
本论文主要介绍了JPEG的编码和解码过程。该程序的编码部分能把一张BMP格式的图象进行JEPG编码,压缩成以二进制形式保存的文件;通过相应的解码程序又可以把图象解压缩出来。在图象传送过程中,我们经常采用JPEG格式对静态图象进行编码。JPEG基本系统是一种有损编码,无法完全恢复出原图象,信息有一定的丢失,称为有损压缩。尽管我们希望能够无损压缩,但是通常有损压缩的压缩比(即原图象占的字节数与压缩后图象占的字节数之比,压缩比越大,说明压缩效率越高)比无损压缩的高。JPEG编码先把图象色彩RBG变成亮度Y和色度Cr、Cb,它利用人的视觉对色度不敏感的特点,减少一部分色度数据,以达到压缩。 JPEG采取多种编码方式,包含有行程编码(Run Length Coding)和哈夫曼(Huffman)编码,有很高的压缩比。在编码前,先对数据进行分块,离散余弦变换(DCT)及量化,保留能量大的低频信号,丢弃高频信号以达到压缩。解码时,进行熵解码,反量化,反离散余弦变换(IDCT)。
上传时间: 2013-12-21
上传用户:coeus
提出一种基于分形理论和BP 神经网络的航空遥感图像有监督分类方法。该方法尝试将航空图像 的光谱信息和纹理特征相结合。它首先将彩色航空图像由RGB 格式转化为HSI 格式,然后,根据亮度计算分 数维、多重分形广义维数谱q-D( q) 和“空隙”等基于分形的纹理特征,同时加入归一化的色度和饱和度作为光 谱特征,采用BP 神经网络作为分类器。通过对彩色航空图像的分类实验,结果证实该方法行之有效。
上传时间: 2014-01-11
上传用户:qq1604324866
视频编码电路主要实现接收8位CCIR656格式的YUV数据,(例如MPEG解码数据),并编码成亮度Y和色度信号C,以及合成CVBS信号,经过D/A转换后输出。基本的编码功能包括副载波产生,色差信号调制,同步信号内插。 主要应用在视频处理,军事图像处理。 GM7221设计原理图
上传时间: 2013-12-29
上传用户:Divine