体育游戏app平台这是一种专门用于推理的机器学习芯片-开云·kaiyun(全站)体育官方网站/网页版 登录入口

开云·kaiyun(全站)体育官方网站/网页版 登录入口

开云·kaiyun(全站)体育官方网站/网页版 登录入口

新闻中心

体育游戏app平台这是一种专门用于推理的机器学习芯片-开云·kaiyun(全站)体育官方网站/网页版 登录入口

发布日期:2026-01-09 08:25    点击次数:82

体育游戏app平台这是一种专门用于推理的机器学习芯片-开云·kaiyun(全站)体育官方网站/网页版 登录入口

Trainium是云科技(AWS)专门为逾越1000亿个参数模子的深度学习教师打造的机器学习芯片。在2024年 re:Invent大会上,AWS通知Trainium2负责可用,其性能比第一代居品进步4倍体育游戏app平台,可以在极短的时刻内教师基础模子和谎话语模子。

AWS周二通知,将推出一款由数十万颗自研Trainium芯片构成的巨型东谈主工智能超等计较机,这是其位于德克萨斯州奥斯汀的东谈主工智能芯片计算本质室的最新后果。

该芯片集群将供由东谈主工智能初创公司Anthropic使用,Anthropic是一家东谈主工智能初创公司,近期得总结自亚马逊40亿好意思元的投资。AWS负责计较和汇聚服务的副总裁戴夫.布朗(Dave Brown)暗示,这个名为 “Project Rainier ”的芯片集群将落地好意思国,2025年建成后将成为宇宙上最大的东谈主工智能模子教师集群之一。

在拉斯维加斯举行的年度re:Invent会议上,AWS发布了“Ultraserver”服务器,该服务器由64个自研的互联芯片构成。此外,AWS还在会议上通凯旋为其最新的芯片客户之一。

re:Invent会议上发布的居品突显了AWS此前对自研芯片Trainium的喜悦,其将Trainium视为替代英伟达GPU的备选选项。

凭证研究机构海外数据公司(IDC)的数据浮现,2024年东谈主工智能芯片市集的规模计算为1175亿好意思元,到2027年底展望将达到1933亿好意思元。IDC前年12月的研究浮现,英伟达在东谈主工智能芯片市辘集占据了约95%的份额。

AWS的CEO马特.加曼(Matt Garman)称:“当今,GPU市集只存在一种采选,即是英伟达,如若市集上有其他的采选,咱们笃信客户会很迎接。”

而亚马逊股东AI计谋的关键举措是更新其芯片,这么可合计他们的客户裁减资本,同期在产业链内掌持更多的主动权。掌持更多的主动权成心于亚马逊减少对英伟达的依赖,尽管当今两家公司的关系还非凡亲密。

觊觎英伟达芯片收入的公司并不在少数,包括东谈主工智能芯片初创企业Groq、Cerebras Systems和SambaNova Systems。亚马逊的竞争敌手微软和谷歌也下场拓荒我方的东谈主工智能芯片,并试图减少对英伟达的依赖。

自从2018年推出基于Arm架构的CPU Graviton以来,亚马逊一直死力于于为客户拓荒自研的芯片居品。亚马逊高管暗示,公司的方针是复制Graviton的得手教诲,向客户讲授,其居品固然资本更低,但性能并不失容于市集最初者。

亚马逊造芯,复刻Graviton的得手教诲

AWS的东谈主工智能芯片本质室位于德克萨斯州奥斯汀市,其前身是亚马逊在2015年以约3.5亿好意思元收购的以色列微电子公司Annapurna Labs。

加迪·哈特(Gadi Hutt)在亚马逊收购Annapurna之前就加入了该公司,担任居品与客户工程部的总监。他暗示:“芯片本质室自Annapurna创业之初就已诞生,其时Annapurna安家于奥斯汀的考量恰是但愿所处的位置要筹商芯片巨头设有功绩处的场地。”

该本质室工程部主任拉米·辛诺(Rami Sinno)说,在本质室里面,工程师们可能今天还在装置线上职责,未来就去焊合了。他们会立即入部下手处理任何需要完成的职责,这种留神求实的心态在初创企业中更为常见,而非像亚马逊这么的万亿好意思元公司。

辛诺称,这是故意为之的,因为Annapurna关于东谈主才招聘有我方的领会,并不像行业中的其他公司那样寻找专长于一个领域的“大家”。他们会寻找既精明领土计算又精明信号好意思满性和功率传输,况且还能编写代码的电路板计算师。

“咱们同期计算芯片、中枢、整台服务器和机架。咱们不会比及芯片准备好后再计算主板,”辛诺说。“这让团队大要以超快的速率前进。”

AWS在2018年推出了Inferentia,这是一种专门用于推理的机器学习芯片,行将数据输入AI模子以生成输出的历程。亚马逊高档副总裁兼凸起工程师詹姆斯·汉密尔顿(James Hamilton)暗示,团队起初专注于推理,因为与教师比拟,推理任务对芯片的条款略低。

到2020年,Annapurna仍是准备好推出其首款面向客户用于教师AI模子的芯片“Trainium”。前年,亚马逊通知推出Trainium2芯片,称该芯片现已可供客户使用。AWS还暗示,当今正在拓荒Trainium3芯片以及基于该芯片的服务器,其性能将是基于Trainium2芯片服务器的四倍。

规模决定算力,亚马逊服务器搭载芯片数目为英伟达两倍

跟着AI模子和数据集的规模越来越大,为其提供能源的芯片和芯片集群的规模也在束缚扩大。科技巨头们不仅从英伟达购买更多的芯片,还自行计算芯片。如今,他们正试图将尽可能多的芯片蚁集在一个场地。

“越来越大”亦然亚马逊芯片集群的方针,该集群由Annapurna和Anthropic息争构建,见地是让AI初创公司使用该集群来教师和启动其将来的AI模子。亚马逊暗示,该集群的浮点运算才调是Anthropic面前教师集群的五倍。马斯克的xAI最近建造了一台名为Colossus的超等计较机,该计较机使用了10万个英伟达的Hopper芯片。

汉密尔顿说:“你将服务器的规模扩大得越多,就意味着你需要惩办的问题越少,总计教师集群的效力也就越高。一朝你意志到这少量,更大更强就成了方针。”

亚马逊的Ultraserver将64个芯片整合到一个封装中,由四台服务器构成,每台服务器包含16个Tranium芯片。布朗说,比拟之下,英伟达的部分GPU服务器只包含8个芯片。为了将这些芯片组合在总计,变成一个可以达到83.2千万亿次浮点运算的服务器,亚马逊的玄机火器是其汇聚本事NeuronLink,这项本事可以使总计四个服务器相互通讯。

汉密尔顿称,这是他们在不使服务器过热的情况下所能容纳的最大数目。从尺寸上看,它更接近于雪柜大小,而不是紧凑的个东谈主计较机。但布朗和其他高管暗示,这并不是在向客户施压,让他们从亚马逊和英伟达之间二选一。他们更但愿客户可以在其云平台上链接使用我方心爱的居品。

AI编程初创公司Poolside的融合首创东谈主兼CTO艾索.康德(Eiso Kant)暗示,他们公司在使用Amazon的芯片启动其AI模子时,相较于使用英伟达的芯片,可省俭约40%的资本。但时弊是,工程师需要破耗更多的时刻让亚马逊的干系芯片软件平方启动。

康德暗示:“亚马逊平直通过台积电制造芯片,并将其讹诈于我方的数据中心,因此对AI初创企业来说,这是看起来更“适当的采选”。他暗示,亚马逊的赌注下在那处至关紧要,因为在硬件领域,过期敌手6个月就可能意味着业务的散伙。”

苹果机器学习与东谈主工智能高档总监贝诺伊·杜平(Benoit Dupin)在大会上暗示,苹果里面正在测试Trainium2芯片,展望可省俭约50%的资本。

濒临英伟达,Trainium能走多远

分析师暗示,关于大盛大企业来说,采选英伟达如故亚马逊并不是一个病笃的问题。因为大型企业更温雅怎样从启动AI模子中得回价值,而不是研究怎样教师它们。

这么的市集趋势对亚马逊来说是件功德,因为客户不会宝贵到云服务背后是哪家芯片厂商在提供算力。它可以与Databricks这么的云数据公司息争,将Trainium讹诈于云计较,大盛大企业王人不会宝贵到任何各异,因为计较大要平方启动,而且资本还会越来越低。

市集研究和IT商讨公司Gartner的分析师奇拉格.德卡特(Chirag Dekate)暗示,亚马逊、谷歌和微软正在拓荒我方的AI芯片,因为他们知谈自行计算芯片可以省俭时刻和资本,同期提高性能。因为定制硬件可以提供非凡具体的并行化功能,这可能比通用型GPU的性能更好。

研究公司Redburn Atlantic的分析师亚历克斯·海斯尔(Alex Haissl)暗示,AWS在东谈主工智能不太被关注到的领域也有着被低估的实力,包括汇聚、加快器和名为“Bedrock”供企业使用东谈主工智能模子的平台。

不外,公司诱骗关于AWS的芯片大要走多远持怀疑格调,至少当今是这么。AWS CEO加曼说:“本色上,我计算在很长一段时刻内,市集如故会被英伟达占据,因为当今99%的职责负载王人是由它们来处理的,这种情况可能不会转变。然则,我但愿Trainium大要开辟出一个可以的利基市集,它将会是好多职责负载的绝佳采选。

本文由雷峰网编译自:Exclusive | Amazon Announces Supercomputer, New Server Powered by Homegrown AI Chips - WSJ