基于强化学习的飞行自动驾驶仪设计
针对强化学习在连续状态连续动作空间中的维度灾难问题,利用BP神经网络算法作为值函数逼近策略,设计了自动驾驶仪。并引入动作池机制,有效避免飞行仿真中危险动作的发生。首先,建立了TD强化学习算法框架;然后根据经验将舵机动作合理分割为若干组,在不同的飞行状态时,调取不同组中的动作;...
针对强化学习在连续状态连续动作空间中的维度灾难问题,利用BP神经网络算法作为值函数逼近策略,设计了自动驾驶仪。并引入动作池机制,有效避免飞行仿真中危险动作的发生。首先,建立了TD强化学习算法框架;然后根据经验将舵机动作合理分割为若干组,在不同的飞行状态时,调取不同组中的动作;...
1、平台介绍 公司开发平台非常完备,分别是PHS、GSM、CDMA、WCDMA。 自研PDA产品p500已经上市。 TD-SCDMA也在预研中。 固定台产品线也已经成立。 2、方案介绍 GSM部分主要由TI方案和ADI方案,其中ADI方案比较成熟。 CDMA部分主要为QUALCO...
设计了一款基于三网融合的数字家庭媒体中心。采用SMP8644 做高清解码与系统控制,配备UTI 机卡分离的有线数字电视(DVB-C)接收模块、e 家佳家庭子网控制模块、CBHD 蓝光光头机芯和前端处理模块以及一些外围接口,通过SATA 接口可内置或外挂大容量硬盘,通过10/10...
无线技术的持续演进发展、全球无线用户的激增,以及市场对更强大数据承载能力的需求,全面催生了各种新标准的不断涌现,如宽带码分多址 - 高速分组接入 (WCDMA-HSPA)、WCDMA-HSPA+ 以及长期演进技术 (LTE) 等。基于无线服务网络的数据使用呈指数级增长,从而进一步推动了异构网络的...
中继技术作为LTE-Advanced 系统的关键候选技术之一,将为小区带来更大的覆盖范围和更高的系统容量,以及更廉价的网络建设成本。对当前LTE-Advanced 系统中的中继技术进行全面系统的介绍。主要对中继的分类,资源复用方式和引入中继后的干扰情况做重点阐述。 ...