基于强化学习的飞行自动驾驶仪设计
针对强化学习在连续状态连续动作空间中的维度灾难问题,利用BP神经网络算法作为值函数逼近策略,设计了自动驾驶仪。并引入动作池机制,有效避免飞行仿真中危险动作的发生。首先,建立了TD强化学习算法框架;然后根据经验将舵机动作合理分割为若干组,在不同的飞行状态时,调取不同组中的动作;...
针对强化学习在连续状态连续动作空间中的维度灾难问题,利用BP神经网络算法作为值函数逼近策略,设计了自动驾驶仪。并引入动作池机制,有效避免飞行仿真中危险动作的发生。首先,建立了TD强化学习算法框架;然后根据经验将舵机动作合理分割为若干组,在不同的飞行状态时,调取不同组中的动作;...
随着数字信号处理技术的数据量越来越大,双DSP系统将会越来越多的受到青睐。针对基于ADI的BF531双DSP系统的主从通信,设计了基于SPORT口的从硬件到软件的一整套通信机制,并对通信机制进行了优化。通过大量的运行测试,验证了这一系统能够满足任务同步,可靠性和实时性的要求,为同类设计提供了有益的参...
IEEE 802.15.4是低速率、低功耗的无线个人区域网络协议标准。分析了IEEE 802.15.4 的特点,在其上设计了轻量级网络层路由协议并在ZigBit 900平台上实现。路由协议对AODV进行了简化,利用MAC层的应答机制检测链路是否连通。最后对路由协议进行了测试,结果表明本路由设计具有良...
目前在计算机网络实验教学中往往只进行设备配置与管理,使得学生对于协议机制和性能分析没有较好的理解。构建基于NS2仿真软件的TCP协议的实验,在软件中对TCP协议的慢启动、窗口机制以及拥塞控制进行仿真分析。实践表明,在网络实验教学中使用NS2有利于学生更加直观地理解网络协议的实现原理,能得到较好的实验...
近些年来,我国的服务计算范型得到了不断的开发和发展,网络资源的发布、网络维护、网络资源部署以及网络资源的合理配置等等领域都或多或少的产生了很大变化。不管是从个人角度来看,还是从企业整体的角度来看,用户都已经将过去原有的空间限制、时间限制以及组织限制很好的跨越,并且对其创新能力很好的扩展。作为当前形势...