Navigation menu

新闻中心

GPU、FPGA芯片成为增强机器学习的“左膀右臂”

在商业软件中,计算机芯片已经被遗忘了。对于商业应用来说,这是一种商品。由于机器人技术与个人硬件设备的关系更为密切,制造业的应用仍然更多地关注于硬件。 http://image1.hipu.com/image.php?url=0JJrLaQPay 自20世纪70年代以来,人工智能(AI)的地位,特别是在DL领域,硬件与软件之间的关系比以往任何时候都更加紧密。我最近的文章“管理AI”与过度拟合和偏见有关,以及机器学习(ML)系统中的两个主要风险。本专栏将探讨在机器学习系统中不断提到的许多管理者,尤其是业务线管理者可以处理的硬件缩写问题:图形处理单元(GPU)和现场可编程门阵列(现场可编程门阵列,FPGA)。 这有助于理解GPU的价值,因为GPU加速了深度学习应用所需的张亮(张量)处理。FPGA的兴趣在于寻找方法来研究新的人工智能算法,训练这些系统,并开始部署低容量定制系统,现在正在许多工业人工智能应用中研究。虽然这是一个关于FPGA的训练能力的讨论,我认为早期的使用是从F,场的使用。 例如,训练推理引擎(机器学习机器的核心)可能需要千兆字节,甚至是兆字节的数据。当在数据中心运行推理时,计算机必须管理一个可能增加的并发用户请求数。在边缘应用中,无论是在UAV中用于管道的检查还是在智能手机中,该设备必须是小的并且仍然是有效的并且也是可适应的。简而言之,CPU和GPU是两种设备,而FPGA可以有不同的块来做不同的事情,并且可以提供健壮的芯片系统。鉴于所有这些不同的需求,最好了解系统体系结构的当前状态,该体系结构可以支持不同的需求。 有两种主要类型的芯片设计可以驱动当前ML系统、GPU和FPGA。在中期(至少几年),它也可能成为游戏改变者的新技术暗示。让我们看一看。 图形处理单元(GPU) http://image1.hipu.com/image.php?url=0JJrLaz3fL 在机器学习世界中最大的芯片是图形处理单元GPU。这台电脑游戏如何使它在电脑显示器上看起来更好,对于机器学习来说非常重要?为了理解这一点,我们必须回到软件层面。 机器学习的倡导者是深度学习(DL)系统。DL系统是基于各种算法,包括深度神经网络(DNN),卷积神经网络(美国有线电视新闻网),递归神经网络(RNN),以及许多其他变种。你在这三个术语中看到的关键词是“网络”。该算法是该主题的变体。主题是多个节点层,节点和层之间有不同类型的通信。 正在处理多个阵列或矩阵。矩阵(矩阵)的另一个更精确的术语是张亮(张量),因此它被用于整个机器学习行业,如TensorFlow。 现在回到你的电脑屏幕。你可以把它看成是线或列作为像素或点的矩阵。这是一个二维矩阵或张量。当你添加颜色时,添加到每个像素的位大小,当你想要一个快速变化的一致图像时,计算可以很快变得复杂,并在一步一步的CPU中循环。GPU有自己的内存,可以保存整个图形图像作为一个矩阵。然后,可以使用张量数学来计算图像中的变化,然后只改变屏幕上的受影响像素。这个过程比每次改变图像时重新绘制整个屏幕要快得多。 在1993,NVIDIA被设计为创建一个芯片来解决矩阵问题,这些问题是由诸如CPU之类的通用计算机无法解决的。这就是GPU的诞生。 矩阵操作不关心最终产品是什么,而是简单地处理元素。这是一个轻微的过于简单化,因为稀疏矩阵的不同操作(当有许多零时)不同于密集矩阵并且具有不同的工作方式,但是内容不改变操作,并且事实仍然存在。当深度学习理论家看到GPU的发展时,他们很快使用它来加速张量运算。 GPU是机器学习发展的关键,促进了数据中心的训练和推理。例如,NVIDIA VLTA V100张量核心在其基本架构中继续加速,并以较低精度运行推理(这将是另一个主题,意味着更少的比特,意味着更快的处理)。然而,当涉及到物联网时,还有其他问题需要考虑。 现场可编程门阵列(FPGA) http://image1.hipu.com/image.php?url=0JJrLarurd 在字段(字段)中,对所有类型的应用程序有不同的需求。有很多不同的应用,车辆,管道,机器人等等。不同的行业可以为每种类型的应用设计不同的芯片,但这可能非常昂贵,并且会损害公司的投资回报率。它也可能延迟上市时间,错过重要的商业机会。对于高度个性化的需求来说,这尤其适用于无法提供规模经济的需求。 FPGA是一个帮助企业和研究人员解决问题的芯片。FPGA是一个集成电路,可以被编程用于许多目的。它具有一系列“可编程逻辑块”和一种编程块和块之间的关系方法。这是一个通用的工具,可以定制为多个目的。主要供应商包括新联和国家仪器公司。 值得注意的是,芯片设计的低成本并没有使FPGA成为一个低价格的选择。它们通常最适合研究或工业应用。电路和设计的复杂性使得它具有可编程性,不适用于低成本的消费应用。 因为FPGA可以被重新编程,所以它对新的机器学习领域很有价值。算法不断增加,重新编程块被用来微调不同的算法。此外,低精度推断低功耗FPGA是远程传感器的良好组合。虽然发明人把“字段”称为“客户”,但FPGA在实现AI应用中的真正优势在于实际领域。FPGA允许系统设计者灵活地使用一块硬件来实现多种用途,从而实现更简单的物理设计,从而使得网站更容易被使用,无论是用于工厂、道路和管道的设施,还是远程检测无人驾驶飞行器。克勒斯。 新建筑即将到来 GPU和FPGA是目前有助于解决机器学习如何影响许多市场影响的技术。他们正在做的是让更多的人关注这个行业的发展,并尝试创造一个新的框架来及时应用它。 一方面,许多公司尝试学习张量演算在GPU上的经验教训。惠普、IBM和英特尔为下一代张量计算设备开发了深入学习的项目。与此同时,像Cambricon、GrasCype和WaveCalm这样的初创企业也在尝试着做同样的事情。 另一方面,ARM、英特尔和其他公司正在设计架构,以充分利用GPU和CPU,并使设备瞄准机器学习市场,据说它不仅能实现张量操作的集中化,而且对C周围的其他进程更为强大。矿石AI工艺 尽管这些组织中的一些机构专注于数据中心和其他物联网,但现在谈论它们中的任何一个还为时尚早。 从全球公司到初创企业,有一个警告是,除了最早的信息外,没有其他信息。如果我们看到最早的设备样品在2020最新,这将是一个惊喜,所以他们不会被列入至少五年。