上面是一段实时目标识别的演示, 计算机在视频流上标注出物体的类别, 包
括人、汽车、自行车、狗、背包、领带、椅子等。
今天的计算机视觉技术已经可以在图片、视频中识别出大量类别的物体, 甚
至可以初步理解图片或者视频中的内容, 在这方面,人工智能已经达到了3 岁儿
童的智力水平。这是一个很了不起的成就, 毕竟人工智能用了几十年的时间, 就
走完了人类几十万年的进化之路,并且还在加速发展。
道路总是曲折的, 也是有迹可循的。在尝试了其它方法之后, 计算机视觉在
仿生学里找到了正确的道路(至少目前看是正确的) 。通过研究人类的视觉原理,
计算机利用深度神经网络( Deep Neural Network,NN)实现了对图片的识别,
包括文字识别、物体分类、图像理解等。在这个过程中,神经元和神经网络模型、
大数据技术的发展,以及处理器(尤其是GPU)强大的算力,给人工智能技术
的发展提供了很大的支持。
本文是一篇学习笔记, 以深度优先的思路, 记录了对深度学习(Deep Learning)
的简单梳理,主要针对计算机视觉应用领域。