Q学习算法

机器学习算法之神经网络

该文档为机器学习算法之神经网络讲解文档，是一份很不错的参考资料，具有较高参考价值，感兴趣的可以下载看看………………

标签： 机器学习

上传时间： 2022-02-02

上传用户：
基于在线特征学习机制的跟踪算法

基于在线特征学习机制的跟踪算法，本论文拟实现一个基于boosting的分类器在线学习算法，并将之应用于视觉目标跟踪。

标签： 特征机制跟踪算法

上传时间： 2013-12-17

上传用户：c12228
基于图的机器人路径规划蚂蚁算法

移动机器人路径规划尤其是未知环境下机器人路径规划是机器人技术中的一个重要研究领域，得到了很多研究者的关注，并取得了一系列重要成果。目前已存在许多用来解决该问题的优化算法，但是此类问题属于N-Hard问题，寻求更佳的算法就成为该领域的一个研究热点。为此，根据机器人路径规划算法的研究现状和向智能化，仿生化发展的趋势，研究了一种基于图的机器人路径规划蚂蚁优化算法。算法首先用栅格法对机器人的工作空间进行建模，并用一个状态矩阵表示其状态，由此构造出一个连通图，由一组蚂蚁在图上模拟蚂蚁的觅食行为，从而得到避碰的优化路径。最后，借鉴分枝随机过程和生灭过程的理论知识，用概率的方法从理论上对该算法的收敛性进行了分析，在此基础上，结合计算机仿真结果，证实了本文提出的算法的有效性和收敛性。迄今为止，对于未知环境下机器人路径规划，人们已经探索出了许多有效的求解方法诸如虚拟力场法、基于学习或Q学习的规划方法、滚动窗口规划方法、非启发式方法及各类定位、导航方法等等。近年来，不少学者用改进的遗传算法、神经网络、随机树、蚁群算法等方法对未知环境下机器人路径进行了规划机器人路径规划算法向智能化、仿生化发展是一个明显的趋势.由于已有算法不同程度的存在一定局限性，诸如搜索空间大、算法复杂、效率不高等，尤其对于未知环境，不少路径规划算法的复杂度较高，甚至无法求解，根据日前的研究现状和不足，本文提出了一种用于解决未知环境下机器人路径规划的基于图的蚂蚁算法，理论分析和实验结果都证明了本文算法的有效性和收敛性本课题研究的主要内容本文在用概格法对机器人的工作空间进行建模的基础上，用一个状态矩阵表示其状态，由此构造一个连通图，由一组蚂蚊在图上模拟蚂蚁的觅食行为，从而得到避碰的优化路径并借鉴分枝随机过程和生灭过程的理论知识用概率的方法从理论上对该算法的收敛性进行了分析，结合计算机仿真，证明了本文算法的有效性和收敛性

标签： 机器人路径规划蚂蚁算法

上传时间： 2022-03-10

上传用户：kingwide
终极算法 ——机器学习和人工智能如何重塑世界

第一章机器学习革命学习算法入门为何商业拥护机器学习给科学方法增压10亿个比尔·克林顿学习算法与国家安全我们将走向何方第二章终极算法来自神经科学的论证来自进化论的论证来自物理学的论证来自统计学的论证来自计算机科学的论证机器学习算法与知识工程师天鹅咬了机器人终极算法是狐狸，还是刺猬我们正面临什么危机新的万有理论未达标准的终极算法候选项机器学习的五大学派第三章符号学派：休谟的归纳问题特别说明：仅作为爱好者学习使用（请勿商用）！本文档由人工智能吧（QQ群 565128329）整理提供并更多学习分享，若觉得不错请购买印刷版书籍。约不约“天下没有免费的午餐”定理对知识泵进行预设如何征服世界在无知与幻觉之间你能信任的准确度归纳是逆向的演绎掌握治愈癌症的方法20问游戏符号学派第四章联结学派：大脑如何学习感知器的兴盛与衰亡物理学家用玻璃制作大脑世界上最重要的曲线攀登超空间里的高峰感知器的复仇一个完整的细胞模型大脑的更深处第五章进化学派：自然的学习算法达尔文的算法探索：利用困境程序的适者生存法则性有何用先天与后天谁学得最快，谁就会赢第六章贝叶斯学派：在贝叶斯教堂里统治世界的定理所有模型都是错的，但有些却有用从《尤金·奥涅金》到Siri所有东西都有关联，但不是直接关联推理问题掌握贝叶斯学派的方法马尔可夫权衡证据逻辑与概率：一对不幸的组合第七章类推学派：像什么就是什么完美另一半维数灾难空中蛇灾爬上梯子起床啦第八章无师自通物以类聚，人以群分发现数据的形状拥护享乐主义的机器人熟能生巧学会关联第九章解开迷惑万里挑一终极算法之城马尔科夫逻辑网络从休谟到你的家用机器人行星尺度机器学习医生马上来看你第十章建立在机器学习之上的世界性、谎言和机器学习数码镜子充满模型的社会分享与否？方式、地点如何？神经网络抢了我的工作战争不属于人类谷歌＋终极算法=天网？进化的第二部分

标签： 机器学习人工智能

上传时间： 2022-05-07

上传用户：
基于强化学习的飞行自动驾驶仪设计

针对强化学习在连续状态连续动作空间中的维度灾难问题，利用BP神经网络算法作为值函数逼近策略，设计了自动驾驶仪。并引入动作池机制，有效避免飞行仿真中危险动作的发生。首先，建立了TD强化学习算法框架；然后根据经验将舵机动作合理分割为若干组，在不同的飞行状态时，调取不同组中的动作；其次，构建了BP神经网络，通过飞行过程中的立即奖赏，更新网络的值函数映射；最后，通过数字仿真验证了强化学习自动驾驶仪的性能，仿真结果表明，该算法具有良好的动态和稳态性能。

标签： 化学飞行自动驾驶仪

上传时间： 2013-11-09

上传用户：刘江林1420
全面介绍了典型的算法

全面介绍了典型的算法，采用c++语言描述，将算法和c++相结合，是学习算法的好材料

标签： 典型算法

上传时间： 2013-12-18

上传用户：hoperingcong
本材料积成了各种有关算法的问题讨论

本材料积成了各种有关算法的问题讨论，包含了很多具体事例和问题的求解过程及说明，是学习算法不可或缺的资料

标签： 材料算法问题讨论

上传时间： 2015-06-08

上传用户：xzt
ISOMAP算法

ISOMAP算法，包括dfun.m dijk.m isomap.m l2_distance.m等等等等，一种流形学习算法（很好用，本人编译运行并仿真实现过）

标签： ISOMAP 算法

上传时间： 2013-12-10

上传用户：zhaiyanzhong
自己编写的几个动态规划算法的例子

自己编写的几个动态规划算法的例子，供正在学习算法的人参考

标签： 编写动态规划算法

上传时间： 2015-06-17

上传用户：hebmuljb
回溯算法与八皇后问题算法设计的经典问题

回溯算法与八皇后问题算法设计的经典问题，是学习算法的朋友一定会遇到的问题

标签： 回溯算法算法设计

上传时间： 2015-11-19

上传用户：rishian