什么是计算机视觉?
计算机视觉的使命是教计算机通过连续三个组件使用数字图像和视频来了解和理解环境:
获得
处理
分析
换句话说,计算机视觉的终极目标是教导机器像人一样做出决定。
获得
图像采集是将我们周围的模拟世界转换为数字形式的过程。为此,请使用内置摄像头,数码单反相机以及专业3D相机和激光测距仪。通常情况下,数据是通过这些方法获得的,必须进一步处理才能更有效地使用。
处理
计算机视觉的下一个组成部分是低级图像处理。这种类型的信息对于选择图像中的边缘,点或分段是必需的。它们都是图像中物体的基本几何图形。
像往常一样,图像处理借助于复杂的数学算法来实现。
低级图像处理算法包括:
边缘检测
分割
分类
特征检测和匹配
边缘检测包括多种旨在识别图像中的点的数学方法。该算法分析图像并将其转换为一组曲线段。边缘检测用于突出显示图像上最重要的部分,以减少处理的数据量。
图像分割通常用于定位图像上的对象和/或边界。在分割过程中,算法为图像的每个像素分配一个标签,以便具有相同标签的像素具有某些特征。分割结果是一组覆盖从图像中提取的图像或轮廓的所有部分的片段。
图像分类涉及提取有关图像内容的信息。获得的信息可用于构建专题地图
特征检测和匹配是计算机视觉许多任务中的重要组成部分。这些包括运动结构,图像搜索,对象检测等等。这种方法的主要概念是发现图像信息的抽象。
分析
图像分析和理解是计算机视觉中的最后一步,允许机器做出自己的决定。在这个阶段,应用图像的高级数据和上一步的结果。高级分析的一个例子可以是3D场景映射,对象识别或跟踪。
它在哪里适用?
迄今为止,计算机视觉方法被用于很多领域,例如机器人技术,人机交互和可视化。更具体地说,包括以下热门目的地:
自主车辆
增强现实
汽车追踪
人脸检测
识别动作和手势
图像恢复和处理
计算机视觉挑战
然而,今天,计算机视觉算法的开发者面临着许多困难,例如:
源数据质量不佳
有限的资源
实时内容处理
但世界各地的研究人员继续努力克服这些问题,并继续改进现有的算法。