你有没有想过自动驾驶汽车是如何知道什么时候红灯停下来的,或者你的手机是如何识别你的脸的?
这就是卷积神经网络或简称 CNN 的用武之地。
CNN 类似于人脑,可以分析图像以确定其中发生的事情。 这些网络甚至可以检测到人类会忽略的东西!
在这篇文章中,我们将探索 CNN 深入学习 语境。 让我们看看这个令人兴奋的领域能为我们提供什么!
什么是深度学习?
深度学习是一种 人工智能. 它使计算机能够学习。
深度学习使用复杂的数学模型处理数据。 因此,计算机可以检测模式并对数据进行分类。
在用很多例子训练之后,它也可以做出决定。
为什么我们对深度学习中的 CNN 感兴趣?
卷积神经网络 (CNN) 是深度学习的重要组成部分。
它们允许计算机理解图片和其他 视觉数据. 通过在深度学习中使用 CNN,我们可以训练计算机根据它们“看到”的内容来检测模式和识别对象。
CNN充当深度学习的眼睛,协助计算机了解环境!
来自大脑架构的灵感
CNN 从大脑解释信息的方式中汲取灵感。 CNN 中的人工神经元或节点接受输入、处理它们并将结果作为输出传递,就像大脑神经元在整个身体中所做的那样。
输入层
标准的输入层 神经网络 接收数组形式的输入,例如图片像素。 在 CNN 中,图片作为输入提供给输入层。
隐藏层
CNN 中有几个隐藏层,它们使用数学从图片中提取特征。 有几种层,包括完全链接的、整流的线性单元、池化层和卷积层。
卷积层
从输入图片中提取特征的第一层是卷积层。 输入图像经过过滤,结果是突出图像关键元素的特征图。
稍后汇集
池化层用于缩小特征图的大小。 它加强了模型对移动输入图片位置的抵抗力。
整流线性单元层 (ReLU)
ReLU 层用于赋予模型非线性。 前一层的输出被这一层激活。
全连接层
全连接层对项目进行分类,并在输出层为其分配唯一ID,即全连接层。
CNN 是前馈网络
数据仅以一种方式从输入流向输出。 他们的结构受到大脑视觉皮层的启发,视觉皮层由基本细胞和复杂细胞的交替层组成。
CNN 是如何训练的?
考虑一下您正在尝试教计算机识别猫。
你向它展示许多猫的图像,同时说:“这是一只猫。” 在看过足够多的猫的图像后,计算机开始识别尖耳朵和胡须等特征。
CNN 的运作方式非常相似。 电脑上显示几张照片,并给出了每张图片中的东西的名称。
然而,CNN 将图像分成更小的部分,例如区域。 而且,它学会识别这些区域中的特征,而不是仅仅将图像作为一个整体来查看。
因此,CNN 的初始层可能只检测基本特征,如边缘或角落。 然后,下一层以此为基础来识别更详细的特征,如形式或纹理。
随着计算机查看更多图像,图层不断调整和磨练这些品质。 它一直持续到它变得非常熟练地识别它所接受的训练,无论是猫、脸还是其他任何东西。
强大的深度学习工具:CNN 如何改变图像识别
通过识别和理解图像中的模式,CNN 已经改变了图像识别。 由于它们提供的结果具有很高的准确性,因此 CNN 是图像分类、检索和检测应用程序的最有效架构。
他们经常产生出色的结果。 而且,它们在实际应用中精确定位和识别照片中的对象。
在图片的任何部分寻找图案
无论图案出现在图片中的什么位置,CNN 都能识别它。 他们可以从图片中的任何位置自动提取视觉特征。
这要归功于它们被称为“空间不变性”的能力。 通过简化流程,CNN 可以直接从照片中学习,而无需提取人体特征。
更快的处理速度和更少的内存使用
与传统流程相比,CNN 处理图片的速度更快、效率更高。 这是池化层的结果,它减少了处理图片所需的参数数量。
这样,它们可以降低内存使用和处理成本。 许多领域使用 CNN,例如; 人脸识别、视频分类和图片分析。 他们甚至习惯了 对星系进行分类.
现实生活中的例子
Google图片 是 CNN 在现实世界中的一种用途,使用它们来识别图片中的人和物体。 而且, Azure 和 Amazon 提供使用 CNN 标记和识别对象的图像识别 API。
深度学习平台提供使用数据集训练神经网络的在线接口,包括图片识别任务 NVIDIA 数字.
这些应用展示了 CNN 如何用于各种任务,从小规模商业用例到组织照片。 可以想到更多的例子。
卷积神经网络将如何发展?
医疗保健是一个引人入胜的行业,CNN 有望在其中产生重大影响。 例如,它们可用于评估 X 射线和 MRI 扫描等医学图片。 它们可以帮助临床医生更快、更准确地诊断疾病。
自动驾驶汽车是另一个有趣的应用,其中 CNN 可用于物体识别。 它可以提高车辆对周围环境的理解和反应能力。
越来越多的人也对创建更快、更有效的 CNN 结构感兴趣,包括移动 CNN。 它们有望用于智能手机和可穿戴设备等低功耗设备。
发表评论