深度学习：它是什么、它如何工作以及它的用途

您是否想知道您的手机如何识别您的脸部，或者为什么 YouTube 会推荐您感兴趣的视频？这一切的背后是深度学习——一种允许机器从大量数据中学习并找到正确解决方案的方法。深度学习改变了技术世界，并已渗透到所有商业领域。

您正在阅读《Compass》杂志——高效、安全团队工作的信使。
了解有关指南针的更多信息

什么是深度学习？

深度学习是一种机器学习，它依赖于通过类似于人脑的多层网络来分析数据。

深度学习的本质是计算机独立寻找解决方案。他们从自己的错误中吸取教训，每次都做出越来越准确的预测。该技术广泛应用于许多领域：从图像分析到人类语音识别。

简单来说：深度学习使计算机能够执行以前认为只能由人类完成的任务。
例如，我们想教计算机识别照片中的物体。为此，他需要展示几个例子。如果我们想让计算机区分猫和狗，我们给它一张猫的照片并说：“这是一只猫。”然后我们重复几次。

深度学习是如何诞生的

深度学习的历史始于 1943 年，这要归功于美国科学家 Walter Pitts 和 Warren McCulloch 的工作，他们开发了第一个神经网络模型。他们为自己设定了一个雄心勃勃的目标——模仿人脑中发生的过程。然而，尽管这个想法很有趣，但由于计算能力和少量数据的限制，该技术无法完全发挥其潜力。

20 世纪 70 年代，随着第一批 GPU 的推出，情况开始发生变化。它们处理图形信息的速度比传统处理器快得多。由此，神经网络开始逐渐取代其他人工智能模型。

深度学习在 2010 年代初取得了重大进展。有两个因素在这里发挥了重要作用。首先是增强 GPU 的性能。其次是卷积神经网络的发展。它们的创作灵感来自于人眼的工作。

2012年，深度学习的使用使得图像识别中的错误数量大大减少——高达16%。这是 ImageNet 项目的一部分，该项目是一个用于计算机视觉开发的带注释图像的大型数据库。现在神经网络在这件事上的准确率达到了94-99%。这甚至比人类的能力还要高。

如今，神经网络有助于研究人脑。 2020 年，科学家利用深度学习来寻找颞叶中负责模式识别的区域。

深度学习：重要的是要知道什么

要了解深度学习的工作原理，有必要了解与其相关的基本术语。

神经网络（人工神经网络）是根据人脑原理构建的系统。它们包括由“神经元”组成的层，能够通过模仿人类的思维过程来处理信息。

人工智能 (AI) 是计算机使用通常需要人类智能进行的计算来解决问题的能力。

机器学习是计算机通过分析大量数据进行自我学习的方法。他们寻找模式并利用它们来做出决策。

得益于能够快速处理大量信息的新技术，机器学习使计算机能够自行学习。

机器学习的过程与人类学习类似。例如，孩子开始学习字母，然后转向单词和短语，最后阅读和理解文本。机器学习算法也是如此：它们首先分析简单的数据，然后从更复杂的示例中学习。

专家开发这些算法并向他们提供大量数据进行分析。例如，在训练系统识别网络攻击时，算法会研究此类行为的示例。通过这种方式，它学会根据提供的数据识别黑客。

深度学习 VS 机器学习：有什么区别
了解深度学习和机器学习之间的区别很重要。这是数据分析和解决问题的两种不同方法。它们有何不同：

深度学习是机器学习的一种，但具有更先进的数据处理和分析能力。

监督学习和非监督学习

要了解深度学习的工作原理，熟悉监督学习和无监督学习的概念非常重要。

监督学习或监督学习正在处理数据，其中每个示例都附有正确答案。您向系统示例提供已知答案，它会学习预测新数据的这些答案。

如果系统犯了错误，它会自行纠正。此过程持续进行，直到预测精度可以接受。

监督学习问题的一个例子是确定房地产价格。根据面积、面积和建造年份的数据，系统学习预测房屋的成本。

无监督学习使用数据而不提供具体答案。系统本身试图找到数据中的结构。

这是一个倾听、理解并根据对方情况量身定制对话的机电话数据会。一旦建立了信任，它就会成为有效潜在客户开发的强大催化剂。在我们的探索中，我们揭穿了“电话数据是一门正在消亡的艺术”这一神话。相反，我们强调了它的持久相关性以及它为全面的潜在客户开发策略带来的独特价值。

无监督学习问题的一个例子是根据客户的活动按兴趣对客户进行细分。这里，系统独立地确定哪些用户组具有相似的偏好，而不依赖于预先准备的类别。

深度学习如何运作？

深度学习是一种允许计算机模型根据数据进行预测的技术。

让我们从房地产估值的角度来看看深度学习。我们的任务是开发一个预测公寓价格的系统，考虑到：

物体位置
建造年份
总面积
地面
深度学习模型的结构

我们的数据经过神经网络的多层：

输入层接收初始数据。这里有四个参数：位置、建造年份、面积和楼层。

隐藏层处理接收到的数据。每个这样的层都会执行自己的计算并增加分析的复杂性。这些层的数量和大小是针对每个任务单独选择的。

名字中的“深”意味着网络上有很多这样的隐藏层。

输出层给我们最终的结果——预测房价。

现在让我们弄清楚计算房地产价格的过程是如何发生的。

神经网络的核心是神经元之间的连接。每个连接都有什么是销售收据？它与现金收据有何不同？自己的权重。它显示了每个参数对最终成本的重要性 – 例如位置或面积。

让我们想象一下，房子的建造年份对于评估公寓的成本尤其重要。那么与这个参数的联系将在我们的模型中具有很大的权重。

激活函数

每个神经元使用激活函数来处理信息。该函数修改输入的数据，以便以后使用更方便。它使输出更加标准，并为下一步处理做好准备。

最后阶段
当数据经过神经网络的所有层时，在最后阶段激活函 lob目录数生成最终结果。在我们的例子中，这是房地产价格预测。

因此，利用深度学习，我们可以构建一个可以高精度预测房地产价格的系统。

深度网络训练
训练神经网络是深度学习中最重要也是最困难的阶段。它需要：

数据量大
强大的计算能力
假设我们要估算公寓的成本。为此，我们需要有关价格、位置、建设年限和其他特征的数据。由于特征数量众多，需要收集大量信息。

首先，我们向神经网络提供所有这些数据，并将其结果与数据库中的实际价格进行比较。由于网络尚不知道如何正确使用信息，因此其预测可能不太理想。

为了确定神经网络的错误程度，我们使用一种特殊的测试——损失函数。此检查显示网络预测与实际价格之间的差异。

我们的目标是使损失函数尽可能小。当预测与现实相符时，理想的目标是实现零。

如何最小化损失函数？

神经网络中的权重是决定一个神经元影响另一个神经元的强度的系数。
改变神经元之间的权重有助于最小化损失函数。使用梯度下降法改变权重。它有助于找到损失函数的最小值，指示调整权重的方向。

梯度下降调整权重，使损失函数随着每一步而减小。这个过程必须重复几次。这需要更多的计算能力。

最终，经过反复迭代和调整权重，神经网络学会了高精度地预测房地产的价值。

深度学习的问题

深度学习开辟了新的可能性，但它并不完美。该方法有几个未解决的问题：

获取数据：培训需要大量信息。如果没有合适的数据，这就会成为一个障碍。

强大：深度学习需要强大的计算能力，包括 GPU 等专用硬件。

理解困难：通常很难理解模型为何做出特定选择。

过度训练的风险：存在模型会“记住”训练数据的危险，并且在新信息下表现不佳。

深度学习用在哪里？
2016年，谷歌翻译取得了突破——显着提高了英语、法语、中文和日语之间的翻译质量。文本变得更加自然，几乎达到了专业翻译的水平。这要归功于使用 Google 的 TensorFlow 库向新的深度学习技术的过渡。

深度学习不仅有助于翻译文本。它几乎可以用于任何出现大量数据（大数据）的领域。

语言学：深度学习用于文本分析、语音识别、答案自动化和文本生成。

电子商务和社交网络：算法分析用户偏好并帮助提供个性化优惠。

图像处理：将旧的黑白照片变成彩色。

计算机视觉：该技术有助于识别图像和视频中的物体，常用于医疗和汽车领域。

自动驾驶汽车：深度学习有助于分析环境并做出安全驾驶的实时决策。

内容生成：算法可以根据指定的标准生成文本，包括新闻报道和文学作品。

结论

深度学习改变了人工智能领域。它使机器能够自学和分析数据。这一突破已应用于从医学研究到娱乐行业的各个行业。这里的主要困难是缺乏训练数据和需要强大的计算机。

随着技术的进步和数据获取的扩大，深度学习继续为创新铺平道路。它致力于使与机器的通信变得简单明了，为自动化和人工智能应用的新进步打开了大门。