深度学习的典型应用领域是异常检测、图像分类、缺陷检测和物体定位。与传统的机器视觉方法相比,深度学习神经网络适应性更好,通用性更广。

是指将整个图像划分为“好”或“坏”,例如药片的好坏。

图1– 异常检测

是指将整个图像划分为已定义的类型,例如对仅包含单个物体的图像进行类型分类。例如,猫狗分类。

图2– 图像分类

是指逐像素进行分类,例如可用于检测和定位有缺陷的表面结构。

图3 – 图像分割

包括对图像中一个或多个物体进行分类和定位,例如猫脸定位。

图4 – 物体识别

二、深度学习和机器视觉方法差异

机器学习的步骤是 :人工分析图片的特征,通过图像算法提取特征,然后通过特征的数值来区分物品。在分析的时候不需要大量的图片,只需要几种分类的典型图片,和类别之间的临界图片。人工分析在整个过程当中起到了主导的作用。

深度学习的步骤是 :采集大量图片,标注图片,把图片放进网络训练,查看训练结果,调节参数和网络结构,再次训练,得到最好的结果。深度学习在标注和训练的时候不需要专业,网络会自动提取和筛选特征,规划分割阈值。只是在调整参数和网络结构时需要专业工程师,但是在一些项目中可以不用调整参数和网络结构,通过调整数据来解决准确性问题。

图5 – 不包含特征工程的深度学习

适应性 :基于深度学习的方法还能让机器视觉应用更加具有适应性,这是传统方法不容易实现的。或者说需要很大的人力物力才能实现的。深度学习与传统方法相比,这样可省去特征选取和提取的步骤。在特征选取和提取的步骤中,用户要分析与检测相关属性的机器学习算法,然后才能将其训练为可以检测完整的物体。深度学习网络的显著区别在于,它可以在训练过程中独立地学习相关属性。

检测不同的物体和特征 :深度学习方法的优势是能够检测以不同形式出现的物体或特征,例如表面划痕、不同形状的天然产品或手写字迹。例如在异常检测中,只需使用完美无瑕的物体图像来训练神经网络,即可识别物体在使用过程中造成的损坏。

更强大的物体识别功能 :经过适当训练的神经网络可以很好地识别出变量环境(如变化的背景、不同的分辨率或光源条件)中的物体,无需针对每个可能的特性进行专门训练。但是需要大量的图片数据。

三、使用深度学习的成本

与传统方法相比,为了在应用中充分发挥纯深度学习方法的优势,往往需要对使用的硬件进行额外投资,并需要大量的示例图像来训练神经网络。

额外的硬件 :深度学习架构复杂精巧、功能强大,其突出特点在于它是由大量的神经网络层构成。因此,运行深度学习的应用程序需要用到大量的内存和计算能力。通常只有将计算任务转移到额外的处理器(如GPU显卡)上同时执行计算,才能在可接受的短时间内完成处理工作。

发热量和功耗 :大型神经网络对计算能力的要求较高,因此增加了应用的功耗,并相应地增加了发热量。这尤其会对嵌入式系统造成问题,因为通常需要对嵌入式系统的低功耗和热管理方面进行优化。

大量的训练数据 :要想可靠地识别物体,首先需要大量的训练图像,这些图像会描述和标记所有物体和属性,以便让系统能在尽可能多的不同变量和环境中完成识别。用于训练的不同图像数据量越多,深度学习网络就越容易学会如何识别物体。在开发机器视觉应用时,要获取成百上千幅所需的图像往往是一项艰巨的任务。

大量的人工标注 :获取到的大量数据是不能立即使用的,需要人给这些数据进行标注,例如猫狗分类的图片,需要在图片名上标明哪些是猫,那些是狗这样才能实现数据的训练,对于图像分割,需要精准的标准图像中要分割的区域,这样才能在推理图片的时候得到精准的区域。这些标注工作都只能是人工手动完成,所以在数据大的时候,还需要检测是否有标注错误的问题。

外星眼机器视觉认为:深度学习在识别能力上,算法的适应力上和特征提取和分类的流程上都有一定的优势,但是依赖于大量的标注数据,好在制作这些数据,不需要专业的工程师参与就能完成,而传统的做法还是需要专业工程师来完成,有经验的专家是稀缺资源,一定程度上会影响项目的进度。但目前深度学习的成本还是比较高的,对硬件要求也比较高,而且运行效率比较慢,随着行业发展,硬件性能提升,成本有所下降之后,会更加的普及。 返回搜狐,查看更多

责任编辑:

声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。