花潮论坛

搜索
热搜: 活动 交友 discuz
查看: 539|回复: 31

[时事新闻] 十年磨一剑 英伟达能否掌控人工智能的未来?

[复制链接]

该用户从未签到

1643

主题

28万

回帖

31万

积分

贵宾

Rank: 7Rank: 7Rank: 7Rank: 7Rank: 7Rank: 7Rank: 7

花潮美女鼠牛虎兔龙蛇马羊猴鸡狗猪春风拂面星星情怀七彩绚丽王者至尊妙笔生花共看流星我心永远幸福快乐指尖上的流年花潮贵宾

发表于 2021-6-24 09:40 | 显示全部楼层 |阅读模式

请马上登录,朋友们都在花潮里等着你哦:)

您需要 登录 才可以下载或查看,没有账号?立即注册

x
2021
06/22
07:10
硅谷封面



                               
登录/注册后可看大图
【划重点】
  • 1目前97.4%的人工智能加速器部署的都是英伟达GPU芯片,英伟达在人工智能算法训练市场上占据“近100%”的份额。
  • 2英伟达高管强调这不是误打误撞,公司在进军人工智能市场方面一直非常注重策略性。
  • 3英伟达仍主导谷歌发明的人工智能行业标准MLPerf基准测试。
  • 4英伟达之所以要收购ARM,是想要在边缘推理芯片方面获得更多优势。
  • 5业内人士认为英伟达在隐藏GPU复杂性方面做得非常出色。
  • 6英伟达斥资数千万美元打造人工智能超算是为了吸引行业顶尖人才。

该用户从未签到

1643

主题

28万

回帖

31万

积分

贵宾

Rank: 7Rank: 7Rank: 7Rank: 7Rank: 7Rank: 7Rank: 7

花潮美女鼠牛虎兔龙蛇马羊猴鸡狗猪春风拂面星星情怀七彩绚丽王者至尊妙笔生花共看流星我心永远幸福快乐指尖上的流年花潮贵宾

 楼主| 发表于 2021-6-24 09:40 | 显示全部楼层
(本文约7000字,阅读全文大约需要10分钟)
【编者按】目前英伟达的GPU主导着人工智能芯片领域。但十年过去,越来越多的企业开始利用人工智能来从收集的海量数据寻找规律,而很多机构和组织也在向深度学习研究投入巨额资金。许多初创企业表示,单靠GPU已经落伍,快速发展的人工智能领域需要新的架构。加之物联网生成的海量数据扑面而来,英伟达将如何掌控人工智能的未来?

回复 支持 反对

使用道具 举报

该用户从未签到

1643

主题

28万

回帖

31万

积分

贵宾

Rank: 7Rank: 7Rank: 7Rank: 7Rank: 7Rank: 7Rank: 7

花潮美女鼠牛虎兔龙蛇马羊猴鸡狗猪春风拂面星星情怀七彩绚丽王者至尊妙笔生花共看流星我心永远幸福快乐指尖上的流年花潮贵宾

 楼主| 发表于 2021-6-24 09:40 | 显示全部楼层
以下为文章正文:

                               
登录/注册后可看大图
英伟达到底是如何从显卡制造商发展到主宰人工智能芯片领域的?这个故事似乎和猫有关系。现任英伟达首席科学家的比尔·戴利(Bill Dally)在2010年曾与斯坦福大学同事、计算机科学家吴恩达吃过一次早餐。吴恩达当时正和谷歌合作开发一个项目。戴利回忆道,“他正试图在互联网上找猫。他当时没有这么说,但这就是他正在做的。”

回复 支持 反对

使用道具 举报

该用户从未签到

1643

主题

28万

回帖

31万

积分

贵宾

Rank: 7Rank: 7Rank: 7Rank: 7Rank: 7Rank: 7Rank: 7

花潮美女鼠牛虎兔龙蛇马羊猴鸡狗猪春风拂面星星情怀七彩绚丽王者至尊妙笔生花共看流星我心永远幸福快乐指尖上的流年花潮贵宾

 楼主| 发表于 2021-6-24 09:41 | 显示全部楼层
吴恩达当时正在谷歌旗下的Google X实验室从事研究项目,试图开发出一个能够自主学习的神经网络。这个神经网络播放YouTube上的1000万段视频,并学会如何识别人脸、身体和猫。但吴恩达实现这一点用了几千个CPU芯片。“我当时说,’我打赌我们只用几个GPU就能做到,’”戴利回忆。当时图形图像处理器(GPU)主要用于处理3D渲染等更密集的工作负载,这使得它们在人工智能方面比CPU效果更好。
戴利求助于英伟达深度学习现任研究主管布莱恩·卡坦扎罗(Bryan Catanzaro),希望实现这一想法。结果他做到了。他们只用了12个GPU,就证明GPU的并行处理能力在训练吴恩达的人工智能识别模型时比CPU更快更高效。

回复 支持 反对

使用道具 举报

该用户从未签到

1643

主题

28万

回帖

31万

积分

贵宾

Rank: 7Rank: 7Rank: 7Rank: 7Rank: 7Rank: 7Rank: 7

花潮美女鼠牛虎兔龙蛇马羊猴鸡狗猪春风拂面星星情怀七彩绚丽王者至尊妙笔生花共看流星我心永远幸福快乐指尖上的流年花潮贵宾

 楼主| 发表于 2021-6-24 09:41 | 显示全部楼层
但卡坦扎罗想让大家知道的是,英伟达深耕人工智能并不只是源自那次偶然的早餐。事实上,早在2008年加入英伟达之前,卡坦扎罗还是伯克利大学的研究生时就已经在开发用于人工智能的GPU了。他表示:“英伟达目前所拥有的市场地位绝非偶然。”

                               
登录/注册后可看大图
英伟达深度学习现任研究主管布莱恩·卡坦扎罗(Bryan Catanzaro)

回复 支持 反对

使用道具 举报

该用户从未签到

1643

主题

28万

回帖

31万

积分

贵宾

Rank: 7Rank: 7Rank: 7Rank: 7Rank: 7Rank: 7Rank: 7

花潮美女鼠牛虎兔龙蛇马羊猴鸡狗猪春风拂面星星情怀七彩绚丽王者至尊妙笔生花共看流星我心永远幸福快乐指尖上的流年花潮贵宾

 楼主| 发表于 2021-6-24 09:41 | 显示全部楼层
不论如何,英伟达已经在人工智能芯片领域占据了主导地位,关于公司何时开始以及如何实现这一目标的说辞似乎已无关紧要。目前英伟达的主要营收来源仍然是游戏显卡,但上一财年公司用于数据中心的GPU销售额攀升至67亿美元。2019年,在亚马逊云服务(AWS)、谷歌、阿里巴巴和微软Azure这四大云服务商的数据中心中,97.4%的人工智能加速器中部署的都是英伟达GPU芯片。市场研究公司Cambrian AI Research分析师卡尔·弗罗因德(Karl Freund)表示,英伟达在人工智能算法训练市场上占据“近100%”的份额。在全世界500强超级计算机中,近70%使用的也是英伟达GPU。几乎所有的人工智能里程碑都少不了英伟达的芯片。吴恩达的YouTube视频猫识别系统、DeepMind开发的围棋冠军AlphaGo、OpenAI的语言预测模型GPT-3都是在英伟达的硬件上运行。可以说,英伟达GPU成了人工智能研究人员的立足点。
回复 支持 反对

使用道具 举报

该用户从未签到

1643

主题

28万

回帖

31万

积分

贵宾

Rank: 7Rank: 7Rank: 7Rank: 7Rank: 7Rank: 7Rank: 7

花潮美女鼠牛虎兔龙蛇马羊猴鸡狗猪春风拂面星星情怀七彩绚丽王者至尊妙笔生花共看流星我心永远幸福快乐指尖上的流年花潮贵宾

 楼主| 发表于 2021-6-24 09:41 | 显示全部楼层
尽管英伟达取得了成功,但卡坦扎罗仍然对有关英伟达是误打误撞从游戏领域进入人工智能领域的说法很不满。“我发誓,我读过的每一个故事几乎都是这样的:GPU碰巧在人工智能方面表现出色,英伟达通过向新市场出售现有芯片暂时到手了笔意外之财,很快它们就会被初创公司所取代。”卡坦扎罗说,“但10年来,英伟达在进军人工智能市场方面一直非常注重策略性。”
十年过去,颠覆现有市场的时机已经成熟。越来越多的企业开始利用人工智能来从收集的海量数据寻找规律,而很多机构和组织也在向深度学习研究投入巨额资金。德勤分析师科斯蒂·佩里科斯(Costi Perricos)表示,人工智能将成为各国竞相争夺的焦点。与此同时,深度学习模型的规模和复杂性都在不断增加,需要硬件能提供更多算力。

回复 支持 反对

使用道具 举报

该用户从未签到

1643

主题

28万

回帖

31万

积分

贵宾

Rank: 7Rank: 7Rank: 7Rank: 7Rank: 7Rank: 7Rank: 7

花潮美女鼠牛虎兔龙蛇马羊猴鸡狗猪春风拂面星星情怀七彩绚丽王者至尊妙笔生花共看流星我心永远幸福快乐指尖上的流年花潮贵宾

 楼主| 发表于 2021-6-24 09:41 | 显示全部楼层

                               
登录/注册后可看大图
OpenAI的GPT-3就是其中最极端的例子。这个深度学习系统可以自动生成人们可理解的文本。整个系统由1750亿个参数及变量组成,计算成本约为460万美元。随后,GPT-3被拥有1.6万亿参数的谷歌语言模型所超越。为了提高精度,人工智能系统往往需要更高效的硬件来处理更多参数和数据,但同时也要防止人工智能本身成为更大的环境灾难。丹麦研究人员表示,训练GPT-3所需的能量相当于汽车行驶70万公里的碳排放量。

回复 支持 反对

使用道具 举报

该用户从未签到

1643

主题

28万

回帖

31万

积分

贵宾

Rank: 7Rank: 7Rank: 7Rank: 7Rank: 7Rank: 7Rank: 7

花潮美女鼠牛虎兔龙蛇马羊猴鸡狗猪春风拂面星星情怀七彩绚丽王者至尊妙笔生花共看流星我心永远幸福快乐指尖上的流年花潮贵宾

 楼主| 发表于 2021-6-24 09:42 | 显示全部楼层
人们需要更多的人工智能芯片,也需要更好的人工智能芯片。尽管英伟达的早期研发工作在业内领先一步,但挑战者们正在竞相追赶。谷歌于2015年开始制造自家的人工智能芯片;亚马逊在2016年收购了以色列芯片设计公司Annapurna Labs,从去年开始将数字助理Alexa的大脑换成自家的Inferentia机器学习芯片;百度旗下的昆仑芯片最近估值达到了20亿美元;高通在2019年宣布推出一款人工智能专用芯片Cloud AI 100;IBM正在研究一种低能耗人工智能芯片设计;AMD收购赛灵思,专注于人工智能数据中心;英特尔在2019年为其至强数据中心CPU添加了人工智能加速功能。此外,英特尔先是在2016年以4.08亿美元的价格收购了神经网络芯片公司Nervana,又在2019年以20亿美元收购人工智能芯片制造商Habana Labs。在过去的几年里,Graphcore、SambaNova、Cerebras、Mythic AI、Blaize和TensTorrent等初创公司陆续发布或开始测试人工智能芯片。
但全世界仍处于人工智能领域的早期阶段。吴恩达的猫是十年前才计算出来的;业内大多数初创公司只有几年的历史。随着智能物联网设备开始一场机器对机器的革命,更多的数据集将会流动起来,所有人的观点都集中在同一件事上:如何掌控人工智能芯片的未来。

回复 支持 反对

使用道具 举报

该用户从未签到

1643

主题

28万

回帖

31万

积分

贵宾

Rank: 7Rank: 7Rank: 7Rank: 7Rank: 7Rank: 7Rank: 7

花潮美女鼠牛虎兔龙蛇马羊猴鸡狗猪春风拂面星星情怀七彩绚丽王者至尊妙笔生花共看流星我心永远幸福快乐指尖上的流年花潮贵宾

 楼主| 发表于 2021-6-24 09:42 | 显示全部楼层
打开人工智能大门的GPU
机器学习是一种完全不同的计算工作负载,需要用不那么精确的大量数据完成大量数学运算。传统的高性能计算是将多个系统并在一起,构建出超级计算机来处理科学模拟或金融建模等复杂工作负载。这些任务通常用高精度的64位数据完成计算。相比之下,人工智能计算也需要庞大的计算基础设施,但所使用的数据并没有那么精确,只有16位甚至是8位,这有些类似于超现实图像和上世纪80年代像素化游戏之间的区别。人工智能芯片初创公司Cerebras首席执行官安德鲁·费尔德曼(Andrew Feldman)表示:“数据处理基本上很简单,但也很复杂。”

回复 支持 反对

使用道具 举报

该用户从未签到

1643

主题

28万

回帖

31万

积分

贵宾

Rank: 7Rank: 7Rank: 7Rank: 7Rank: 7Rank: 7Rank: 7

花潮美女鼠牛虎兔龙蛇马羊猴鸡狗猪春风拂面星星情怀七彩绚丽王者至尊妙笔生花共看流星我心永远幸福快乐指尖上的流年花潮贵宾

 楼主| 发表于 2021-6-24 09:42 | 显示全部楼层
人工智能芯片可以是任何针对谷歌TensorFlow或Facebook的PyTorch等机器学习工作负载进行过优化的处理器。在训练或运行深度学习模型时,人工智能芯片不一定要完成所有的计算工作,主要是当作加速器来处理最密集的工作负载。例如,英伟达封装的人工智能系统DGX A100就用8个安培A100 GPU当作加速器,此外还有一个128核的AMD CPU。
人工智能并不是什么新鲜事,但之前人们缺少让深度学习模型成为现实的计算能力,这让研究人员花时间等待硬件的进步。另一家制造人工智能芯片的初创公司SambaNova联合创始人兼首席执行官Rodrigo Liang表示:“GPU打开了人工智能的大门。”

回复 支持 反对

使用道具 举报

该用户从未签到

1643

主题

28万

回帖

31万

积分

贵宾

Rank: 7Rank: 7Rank: 7Rank: 7Rank: 7Rank: 7Rank: 7

花潮美女鼠牛虎兔龙蛇马羊猴鸡狗猪春风拂面星星情怀七彩绚丽王者至尊妙笔生花共看流星我心永远幸福快乐指尖上的流年花潮贵宾

 楼主| 发表于 2021-6-24 09:42 | 显示全部楼层
一年一度的ImageNet计算机视觉挑战赛让研究人员相互竞争,开发能够识别图像或物体的算法。2012年,多伦多大学研究人员亚历克斯·克里热夫斯基(Alex Krizhevsky)基于GPU的深度学习系统击败了其他参赛者。到2015年,所有在ImageNet中排名靠前的参赛者用的都是基于GPU硬件的算法。
这让深度学习研究呈现爆炸式增长的局面。英伟达的技术让深度学习处理速度提高了20倍以上。但英国芯片初创公司Graphcore联合创始人在公司刚刚成立时却一度找不到投资者。“我们从风投那里经常听到的一句话是:’什么是人工智能?’”该公司联合创始人兼首席技术官西蒙·诺尔斯(Simon Knowles)回忆起2015年去加州寻求融资的经历时这样说。“令人惊讶的是,几个月后,也就是2016年初,一切都变了。那时每个人都热衷于人工智能,”诺尔斯说。“然而,他们对芯片硬件却没有那么感兴趣。”新的芯片架构当时被认为没有必要,英伟达已经占据了整个行业。

回复 支持 反对

使用道具 举报

该用户从未签到

1643

主题

28万

回帖

31万

积分

贵宾

Rank: 7Rank: 7Rank: 7Rank: 7Rank: 7Rank: 7Rank: 7

花潮美女鼠牛虎兔龙蛇马羊猴鸡狗猪春风拂面星星情怀七彩绚丽王者至尊妙笔生花共看流星我心永远幸福快乐指尖上的流年花潮贵宾

 楼主| 发表于 2021-6-24 09:43 | 显示全部楼层
但是2016年5月,谷歌改变了一切。Cerebras的费尔德曼称谷歌做出了一个“夸张的战略决策”,宣布谷歌已经为人工智能应用自行开发芯片。这些所谓张量处理单元(TPU)的芯片就是为了与谷歌TensorFlow机器学习编程框架协同工作。Graphcore的诺尔斯表示,此举向投资者发出了一个信号,即新的人工智能芯片设计或许有市场。“突然间所有的风投都在想:那些疯狂的英国人现在在哪儿?”诺尔斯说。从那之后,Graphcore拿到了7.1亿美元的融资。
英伟达的竞争对手们认为,GPU是为图形图像处理而非机器学习设计的,尽管其强大的处理能力意味着比CPU更胜任人工智能任务。但由于系统优化的局限性和软件层的复杂性,它们的市场主导地位只能维持这么长的时间。“英伟达在隐藏GPU复杂性方面做得非常出色,”Graphcore联合创始人兼首席执行官奈杰尔·图恩(Nigel Toon)表示。“GPU之所以有效,是因为他们开发的软件库、框架并进行优化,隐藏了计算层面的复杂性。对于英伟达来说,这是一项非常艰巨的任务。”

回复 支持 反对

使用道具 举报

该用户从未签到

1643

主题

28万

回帖

31万

积分

贵宾

Rank: 7Rank: 7Rank: 7Rank: 7Rank: 7Rank: 7Rank: 7

花潮美女鼠牛虎兔龙蛇马羊猴鸡狗猪春风拂面星星情怀七彩绚丽王者至尊妙笔生花共看流星我心永远幸福快乐指尖上的流年花潮贵宾

 楼主| 发表于 2021-6-24 09:43 | 显示全部楼层
但抛开GPU的话,可能需要从头开始设计拥有全新架构的人工智能芯片。谷歌的TPU芯片是针对特定工作负载设计的专用集成电路;Cerebras开发的则是晶圆级引擎,这种巨型芯片要比其他芯片大56倍;IBM和BrainChip则是以人脑为模型开发神经形态芯片;而Mythic和Graphcore生产的是智能处理单元(IPU),但设计有所不同。
但卡坦扎罗认为,许多芯片只是人工智能加速器的变体。他说:“我们可以说GPU、TPU或IPU或其他什么,但人们只是很习惯这些字母。“我们这样称呼GPU是因为以前就这么说……但GPU一直是用于加速计算的,而人们所关心的工作负载性质在不断变化。”

回复 支持 反对

使用道具 举报

该用户从未签到

1643

主题

28万

回帖

31万

积分

贵宾

Rank: 7Rank: 7Rank: 7Rank: 7Rank: 7Rank: 7Rank: 7

花潮美女鼠牛虎兔龙蛇马羊猴鸡狗猪春风拂面星星情怀七彩绚丽王者至尊妙笔生花共看流星我心永远幸福快乐指尖上的流年花潮贵宾

 楼主| 发表于 2021-6-24 09:43 | 显示全部楼层
有谁能和英伟达抗衡?目前英伟达仍主导MLPerf基准测试.MLPerf是深度学习芯片的黄金标准。市场研究公司Cambrian AI Research分析师卡尔·弗罗因德(Karl Freund)指出,由学术界和行业参与者设计的标杆工具MLPerf目前由谷歌和英伟达主导,但初创企业通常不会费心去完成所有这类测试,因为打造一个系统的成本最好花在别处。

                               
登录/注册后可看大图
每个英伟达SuperPOD内有20个DGX人工智能系统

回复 支持 反对

使用道具 举报

该用户从未签到

1643

主题

28万

回帖

31万

积分

贵宾

Rank: 7Rank: 7Rank: 7Rank: 7Rank: 7Rank: 7Rank: 7

花潮美女鼠牛虎兔龙蛇马羊猴鸡狗猪春风拂面星星情怀七彩绚丽王者至尊妙笔生花共看流星我心永远幸福快乐指尖上的流年花潮贵宾

 楼主| 发表于 2021-6-24 09:44 | 显示全部楼层
英伟达在每年的MLPerf测试中都要超过谷歌的TPU。“谷歌发明MLPerf来显示他们的TPU有多好,”英伟达解决方案架构和工程主管马克·汉密尔顿(Marc Hamilton)说,“黄仁勋说,只要每次跑MLPerf测试时我们的GPU都能超过谷歌TPU就行,哪怕只有一点就很好。”
据称,为了确保能在某次基准测试中名列前茅,英伟达将一台超级计算机所搭载的DGX系统从36个升级到96个,这需要对整台设备重新布线。为了尽快完工,工程师们直接剪断了各种线缆,汉密尔顿说整套线缆价值100万美元。这种疯狂行为凸显出基准测试的刺激作用,但也启发英伟达对DGX系统进行重新设计。如今的DGX系统能以20个为一组自由组合,无需重新布线。

回复 支持 反对

使用道具 举报

该用户从未签到

1643

主题

28万

回帖

31万

积分

贵宾

Rank: 7Rank: 7Rank: 7Rank: 7Rank: 7Rank: 7Rank: 7

花潮美女鼠牛虎兔龙蛇马羊猴鸡狗猪春风拂面星星情怀七彩绚丽王者至尊妙笔生花共看流星我心永远幸福快乐指尖上的流年花潮贵宾

 楼主| 发表于 2021-6-24 09:44 | 显示全部楼层
转战边缘推理
当涉及到基准测试和组装超级计算机时,人们总是可以通过添加更多人工智能芯片来提高性能。但对于另一种人工智能计算,也就是边缘推理则完全不同。
2020年,英伟达宣布将以400亿美元的价格收购英国芯片设计公司ARM,吸引了全世界的目光。要知道,后者的芯片架构被用于全球95%的智能手机。但业内反响并不很积极。仍持有公司股份的ARM联合创始人赫尔曼·豪泽(Hermann Hauser)称这是一场“灾难”,可能会破坏ARM在市场中的中立地位。世界各地的监管机构都在密切关注这笔交易。

回复 支持 反对

使用道具 举报

该用户从未签到

1643

主题

28万

回帖

31万

积分

贵宾

Rank: 7Rank: 7Rank: 7Rank: 7Rank: 7Rank: 7Rank: 7

花潮美女鼠牛虎兔龙蛇马羊猴鸡狗猪春风拂面星星情怀七彩绚丽王者至尊妙笔生花共看流星我心永远幸福快乐指尖上的流年花潮贵宾

 楼主| 发表于 2021-6-24 09:44 | 显示全部楼层
ARM只设计芯片,并将知识产权授权给芯片制造公司。如果某个人工智能芯片制造商需要一款CPU,他们可以从ARM获得芯片设计许可,并按照自家规格进行制造。竞争对手担心英伟达控制ARM后可能会限制相关合作,不过黄仁勋曾“明确”表示,英伟达将尊重ARM现有的开放模式。
边缘推理芯片能够将深度学习用于现实世界,而ARM正是这种芯片的主要设计者。英伟达收购ARM意味着可能对现有市场态势产生巨大影响。在ARM的帮助下,英伟达可以凭借GPU和边缘推理方面的优势地位在数据中心领域占据主导地位。

回复 支持 反对

使用道具 举报

该用户从未签到

1643

主题

28万

回帖

31万

积分

贵宾

Rank: 7Rank: 7Rank: 7Rank: 7Rank: 7Rank: 7Rank: 7

花潮美女鼠牛虎兔龙蛇马羊猴鸡狗猪春风拂面星星情怀七彩绚丽王者至尊妙笔生花共看流星我心永远幸福快乐指尖上的流年花潮贵宾

 楼主| 发表于 2021-6-24 09:45 | 显示全部楼层
什么是边缘推理?为了训练和应用人工智能模型,英伟达的高性能系统会对数据进行大量处理。但在人工智能领域,还有推理这种更轻量级的任务,也就是使用训练过的模型来解释某些现实景象。比如无人驾驶汽车理解摄像头看到的东西,一个智能手机应用程序扫描用户脸部,把猫耳朵贴在自拍照上,或者一个对医学影像进行病理分析等等。由于训练需要巨大算力,通常会在数据中心完成;但推理可以在数据中心、也可以在边缘设备上完成。
第一种推理在数据中心完成。当你问数字助理Alexa或Siri一个问题时,其会被传送回亚马逊和苹果的服务器进行转录并回复。第二种推理则发生在相机、汽车或智能手机等终端用户设备中,这被称为边缘计算。第二种推理需要的算力不多,但处理速度要快。

回复 支持 反对

使用道具 举报

该用户从未签到

1643

主题

28万

回帖

31万

积分

贵宾

Rank: 7Rank: 7Rank: 7Rank: 7Rank: 7Rank: 7Rank: 7

花潮美女鼠牛虎兔龙蛇马羊猴鸡狗猪春风拂面星星情怀七彩绚丽王者至尊妙笔生花共看流星我心永远幸福快乐指尖上的流年花潮贵宾

 楼主| 发表于 2021-6-24 09:45 | 显示全部楼层
英伟达目前主导着数据中心领域的推理工作。其A100利用数据进行训练,而推理被虚拟化到更小的迷你服务器中,在同一硬件上能同时完成50个或更多推理工作负载。这对AWS等提供人工智能服务的科技巨头很有帮助,因为多家公司可以使用相同硬件而且不会有数据泄露的风险。在边缘计算领域,英伟达拥有用于无人驾驶汽车的DRIVE芯片和用于现场推理的EGX芯片,但低功耗芯片并不是英伟达的专长所在。如果你曾经使用过搭载英伟达显卡的游戏笔记本电脑,就会发现其电池续航时间比Chromebook要短。但设计低功耗芯片是ARM最擅长的事情,这也是为什么英伟达不惜斥资400亿美元收购ARM的原因。
ARM在人工智能领域的研究主要集中在两个方面。首先,其将软件框架整合到现有CPU上。为了应对更密集的工作负载,ARM开发了一种名为Ethos的神经处理单元(NPU)当作人工智能加速器使用。ARM IP产品部门总裁雷内·哈斯(Rene Haas)说,使用Ethos-U55设计的设备应该很快就会上市,因为获得该设计许可的公司已经生产出了成品芯片。

回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|服务支持:DZ动力|huachaowang.com Inc. ( 蜀ICP备17032287号-1 )

GMT+8, 2025-12-17 03:42 , Processed in 0.114806 second(s), 25 queries .

Powered by Discuz! X3.4

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表