橘子百科-橘子都知道橘子百科-橘子都知道

正、异、新,正异新的区分

正、异、新,正异新的区分 “AI春晚”英伟达放大招:亮算力“杀器”、助游戏“捏人”;黄仁勋帮算账:GPU多买多省

  “AI热(rè)潮(cháo)”最大赢家之一(yī)、英伟达背后的那个身(shēn)穿黑色(sè)皮衣的男(nán)人又(yòu)来(lái)了。

  前(qián)脚才交出亮(liàng)眼业(yè)绩狂(kuáng)拉股价,英(yīng)伟达CEO黄仁勋后脚就在昨日的(de)COMPUTEX大会上(shàng)宣(xuān)布,“我们已到达生成式AI引爆点。正、异、新,正异新的区分从(cóng)此(cǐ),全世(shì)界的每个角落,都会(huì)有计算(suàn)需求。”

  如今英伟达掌(zhǎng)握着(zhe)全球多家(jiā)科技公司“算力(lì)命脉”,而在(zài)这场大(dà)会上,黄仁勋激情演讲2个小(xiǎo)时,甩出了多项重磅新(xīn)发布,包括算力“杀器(qì)”DGX GH200超(chāo)级计算机、针对游戏(xì)的ACE代工服务、MGX服务(wù)器规范等(děng)内容。

  算力“杀器”:DGX GH200超级计算机+GH200超(chāo)级(jí)芯片

  先(xiān)看“集成了英伟(wěi)达(dá)最先进加速计算和网络技(jì)术”的DGX GH200人工智能超级计(jì)算机

  这款超算专为大规(guī)模生成式(shì)AI的负(fù)载所设计,由256块GH200超(chāo)级芯片(piàn)组成,拥有1 exaflop超凡(fán)AI性能、144TB内存(是英伟(wěi)达目前DGX A100系统的(de)近500倍)、150英(yīng)里(lǐ)光纤、2000多个风扇。

  DGX GH200重达40000磅(约合18143千克),堪比四只成年大象的(de)体重。

  预计DGX GH200将于今年年底投入问世,英伟达暂未公(gōng)布价格,而谷(gǔ)歌(gē)云、Meta与微(wēi)软(ruǎn)将是首批用户

  同时,英伟达也(yě)正(zhèng)在打(dǎ)造自家基于DGX GH200的大型AI超级(jí)计算机NVIDIA Helios,以支持其研(yán)究和开发团(tuán)队(duì)的工(gōng)作(zuò)。其中(zhōng)采用4个DGX GH200系统、1024颗(kē)Grace Hopper超级(jí)芯片(piàn),每个都将与英伟达(dá)Quantum-2 InfiniBand网络连接(jiē),带宽高达400Gb/s,将(jiāng)于今年年底上线。

  值得一(yī)提的(de)是,黄仁勋透露,DGX GH200集(jí)成的GH200 Grace Hopper超级芯片已进入全面生产

  “拉(lā)踩”CPU:成本(běn)、功耗、处理数据量不如GPU

  在本(běn)次(cì)大会上,黄(huáng)仁勋还“拉踩”了(le)一(yī)波CPU。他从功耗(hào)、处理数据(jù)量等方面,指出使用GPU胜过CPU。

  举例来说,花费1000万美元,可以建设一个有960颗CPU的数据中心,其可处理(lǐ)1X LMM(大语言模型)数据量,需要(yào)11GWh功耗;

  同样成本下(xià),也可以建设一个有48个GPU的数(shù)据中(zhōng)心,其可处理44X LLM数据量(liàng),仅需要3.2GWh功耗(hào)。

  若(ruò)只想处理1X LMM数(shù)据量,则只需40万美元,便可拥(yōng)有一个(gè)搭载2个GPU、功(gōng)耗仅(jǐn)0.13GWh的(de)数(shù)据(jù)中心。

  “买越多,省(shěng)越多(duō)(The more you buy, the more you save)。”黄(huáng)仁勋再(zài)次表示。

  同时,他(tā)也列出了(le)数据中(zhōng)心(xīn)成(chéng)本公(gōng)式:数据中(zhōng)心总持有成本=f[成本(芯(xīn)片(piàn)、系统、硬件生态系统)、吞吐(tǔ)量(liàng)(GPU、Algo软件、网络、系(xì)统软件、软件生(shēng)态系(xì)统)、使用(yòng)率(Algo Lib, 软件生态系(xì)统(tǒng))、采购(gòu)运营、生(shēng)命周期最佳化(huà)、电力]

  ACE代工服务:用AI激活(huó)NPC生(shēng)命

  游戏一直(zhí)是备受关注的一(yī)大AI应(yīng)用落地领(lǐng)域(yù)。英(yīng)伟达也在(zài)大会(huì)上宣布,推出面向游戏的定制AI模型(xíng)代工服务NVIDIA Avatar Cloud Engine(ACE)

  它能(néng)赋(fù)予(yǔ)非玩家角色(NPC)更(gèng)智(zhì)能且不断进化(huà)的对(duì)话技能,中间件(jiàn)、工具(jù)和游(yóu)戏开发者(zhě)可使用它(tā)来构建和(hé)部署定制的语音、对话和动画(huà)AI模型

  其中包括:英伟达NeMo,使用专有(yǒu)数据构(gòu)建、定制和部署语言(yán)模型;英伟(wěi)达Riva,用于自(zì)动语音(yīn)识别和文本(běn)转语(yǔ)音实现实时语音对话;英伟达Omniverse Audio2Face,用于(yú)即时(shí)创建(jiàn)游戏角色表情(qíng)动画,以匹配任何语音轨道。

  开发人员(yuán)可选择集(jí)成(chéng)整个NVIDIA ACE for Games解决方案,也可仅使用需要的组(zǔ)件。

  新参(cān)考工作流(liú)程(chéng):帮(bāng)助建设(shè)数字化智能(néng)工(gōng)厂

  黄仁勋表示(shì),全(quán)球电子制造商正(zhèng)在使用一种全新的综合(hé)参(cān)考工(gōng)作流程(chéng)推进工业数字化工作,该工(gōng)作流程结合了(le)英伟达用于生(shēng)成(chéng)式AI、3D协作、仿真和自主机器的技术,包括:

  英(yīng)伟达Omniverse,其连接了顶级计算(suàn)机(jī)辅(fǔ)助设计应(yīng)用以及生成式AI的API和前沿框架;用于模拟和测试机器人的英伟(wěi)达(dá)Isaac Sim应用程序(xù);英(yīng)伟(wěi)达Metropolis视觉AI框架,用于自(zì)动(dòng)光学检测。

  同时,黄仁(rén)勋现场展示了一(yī)个完全数字化的(de)智能工厂(chǎng)的演示。

  目前富(fù)士(shì)康工业互联(lián)网、宜鼎国际、和硕(shuò)、广(guǎng)达(dá)和纬创(chuàng)正在(zài)使用这一参考工作流(liú)程,具体用例(lì)包括电路板质保检测点(diǎn)自动化、光学检测自动化、建(jiàn)设虚拟工厂、模拟(nǐ)协作(zuò)机器人、构建及运(yùn)营数字孪生等。

  MGX服务器(qì)规(guī)范:快速高效构建百余种服务(wù)器配置

  英伟达发(fā)布(bù)NVIDIA MGX服务(wù)器规范,为系统制造商(shāng)提供模块化参考架(jià)构,满足各种规模的数据中心(xīn)需求。系统制(zhì)造(zào)商(shāng)可使用它快速(sù)且经济高(gāo)效地构建100多种服务(wù)器配置(zhì),以适应广泛的AI、HPC及NVIDIA Omniverse应用。

  MGX支持英伟达(dá)全(quán)系列(liè)GPU、CPU、DPU和网络适(shì)配器、各种x86、完整软件堆栈(zhàn)及(jí)Arm处理(lǐ)器(qì),还可集成到云(yún)和企业数据中心中。

  华硕(shuò)、和硕(shuò)、QCT、超微(wēi)(Supermicro)等都将采用MGX构建下一代加速计算机(jī),可将开发成本削减多达3/4,并(bìng)将开发时间(jiān)缩短(duǎn)2/3至仅(jǐn)需6个月

  其中(zhōng),QCT和(hé)超微基于MGX的设(shè)计(jì)将于8月面世。超(chāo)微昨日公布的ARS-221GL-NR系(xì)统将采(cǎi)用Grace CPU,而QCT的S74G-2U系统将采用Grace Hopper。

  推(tuī)出Spectrum-X网(wǎng)络平台 构(gòu)建超大规模生成式(shì)AI超级计算机Israel-1

  另外,黄仁(rén)勋宣布推(tuī)出NVIDIA Spectrum-X网络(luò)平台,旨在提(tí)高基于以太网(wǎng)的AI云的性能(néng)和(hé)效率。

  相比传统以太网结构,Spectrum-X可实现1.7倍的整体AI性能和能效提(tí)升(shēng),并具(jù)有高(gāo)度通用(yòng)性,可用于(yú)各种AI应用。它使用完全基于标准的以太网,并(bìng)可与基于以太网的堆栈(zhàn)互操(cāo)作。该平台支持256个(gè)200Gb/s端口,通过单个交换机(jī)连接(jiē),或在两(liǎng)层(céng)leaf-spine拓扑中(zhōng)提供(gōng)16000个端口,以支持AI云增(zēng)长和扩展,在保(bǎo)持性能的同时最大限度减少网络延(yán)迟。

  全球领先(xiān)云计算(suàn)提(tí)供(gōng)商正在(zài)采用Spectrum-X平台正、异、新,正异新的区分扩展生成式AI服务,而(ér)Spectrum-X、Spectrum-4交换机(jī)、BlueField-3 DPU等已在戴尔(ěr)、联想等(děng)系统制造商处提供。

  此外,作为Spectrum-X参考设计的蓝图(tú)和测试平台,英伟达正(zhèng)构建一台(tái)超大规模生成式AI超级(jí)计算机Israel-1。这台AI超算价值(zhí)数亿(yì)美元,将采(cǎi)用戴尔PowerEdge XE9680服务器、英伟达HGX H100超级计算平台、内置BlueField-3 DPU和Spectrum-4交换机的Spectrum-X平台。

  结语

  “40年(nián)来,我(wǒ)们创造了PC、互联网、移动(dòng)、云(yún),现(xiàn)在是人工智能时(shí)代。你会创造什么(me)?不管是什么,都要像我(wǒ)们一样追赶(gǎn)它。要奔跑,不要走。要么为了食(shí)物奔(bēn)跑,要么作为食物奔跑(pǎo)。”

  在5月27日的台湾(wān)大(dà)学发表了(le)毕业典礼演(yǎn)讲上,黄仁(rén)勋再次强调了掌握AI技术的重要性:很多人担心,AI会(huì)抢走自(zì)己的工作。但(dàn)真正会(huì)抢走你饭碗(wǎn)的(de),是掌握(wò)了AI技术的人(rén)。

  他表(biǎo)示,从各方(fāng)面来看,AI的兴盛是计算机(jī)产(chǎn)业(yè)的再生契机。在下个十年,我们的产业将(jiāng)使用(yòng)新型AI电脑,取代(dài)价值万(wàn)亿美元的传统电(diàn)脑。

  而从昨日大会上黄仁勋的展(zhǎn)示中,人工智能时代的未来轮(lún)廓似乎(hū)已逐渐浮(fú)现。

未经允许不得转载:橘子百科-橘子都知道 正、异、新,正异新的区分

评论

5+2=