凤凰彩票APP 我合计被英伟达吊打的AMD, 在数据中心赚麻了


提到 AI 期间的最大赢家,差友们的第一反馈,细则是英伟达吧?
毕竟老黄这两年靠着给 AI 厂商"卖铲子",营收和市值都"遥遥跳跃"。而这一切,都成绩于 20 年前老黄半信半疑,坚抓 CUDA 生态——这一把,真让他赌对了。

但你可能思不到,还有一家公司,左手拿着性颖慧不外英伟达的显卡,右手攥着 "过时" 的 4nm 工艺,果然也在 AI 竞争里赚得盆满钵满。
而它就是——A M D!
等会,这是若何作念到的?
前段时刻,托尼受邀参加了AMD的AI开拓者大会,转头后,我对这个问题有了一些谜底。

不外这事儿嘛。。。得从十多年前苏妈靠锐龙翻身那会儿提及。
锐龙降生之前,AMD 的处理器一直活在 "i3 默秒全" 的暗影里。

直到 Zen 架构横空出世——在 "硅仙东谈主" 吉姆·凯勒的教唆下,初代锐龙 IPC 性能实打实升迁了 52%,8 核 16 线程的规格,更是在阿谁 4 核称王的年代震荡全场,也拉开了芯片厂之间 "核干戈" 的序幕。

到了 2020 年的 Zen 3系列,AMD 终于一雪前耻:单核、多核性能双双干翻了英特尔同期旗舰。
而 AMD 的这场收效,也缓缓从破钞商场膨胀到数据中心 B 端。说到数据中心,好多东谈主当今的第一反馈,应该是老黄和他的 GPU 的世界。
但其实,从早期编造机、云就业,到如今的 AI,都离不开 CPU 的调和调理。
所谓数据中心,其实就是一个超等物流中心,本色是百万级的 "小快递" 同期配送。

即使单核 CPU 再快,面临百万小件,那亦然分身乏术;而多核 CPU,就像雇了一支宽阔的“司机车队”同期启程,还能通过“拼车”(编造化)就业更多客户,把遵守拉满。
也就是说,到了数据中心这边,别管这那的,我就要阿谁核多的超大杯。
尤其是当今 AI 智能体兴起,器具调用、任务编排,还得靠 CPU 来干活。以至于前段时刻的 GTC ( GPU 技能大会 )上,老黄也掏出属于英伟达的 CPU 来。

可这事儿呢,反倒是 AMD 的老本行了。在锐龙处理器阐明了 Zen 架构的实力之后,AMD 的下一步,就是剑指数据中心。
十年前,数据中心的 x86 处理器,如故英特尔的一言堂:2016 年至强 Broadwell 最高 24 核,2017 年至强 Skylake-SP 最高 28 核。
可就在同庚,AMD 初始爆种,掏出了 32 核的初代 EPYC 处理器。
而在接下来的十年里,AMD 把 EPYC 的中枢数一谈堆到了 256 核 512 线程!英特尔也被迫跟进,作念出了 128 个大核、288 个小核的居品……

谁说英特尔不会堆中枢?这不是挺会的嘛。
是以一又友们,不是英特尔一刹有了良心,A8体育2026世界杯(中国)IOS/安卓官方下载仅仅因为苏妈来过。。。
天然,光靠"低廉大碗"给家东谈主们谋福利还不够,AMD 还祭出了杀手锏——
3D V-Cache。
所谓 3D V-Cache,指的是在CPU上加一块大容量缓存。像是最早的 5800X3D,把 L3 缓存加到了 96M,对比平时版翻了 3 倍。
缓存大,关于打游戏来说,意味着帧数更高、更踏实。

但缓存大可不单对游戏灵验,在数据中心不异能大杀四方。不管是需要超低延长的金融往复,如故仿真谋略、有限元分析这类重谋略任务,都能靠 3D V-Cache 取得夸张的性能升迁。
就拿 EPYC 9684X 来说,96 中枢塞了足足 1152MB 三级缓存,比拟竞品(至强 8490H)的上风简直达到了 3 倍。
这些功能特质方面的进入,让 AMD 在本年绝对收到了答复。事到如今,哪个数据中心会不可爱 AMD 的 EPYC 处理器呢?
这种可爱,在商场份额上就体现得相配的确:2019 年之前,Intel 在数据中心的份额一度高达 97%;可跟着 EPYC 的崛起,这个数字在 2025 年降到了 70% 傍边。

换句话说,AMD 只用了短短 6 年,就从零拿下了 30% 的商场份额。
看来真香定律,在数据中心这亦然能设置的。。。

靠着向数据中心卖 CPU,AMD 再也不会像仍是一样风雨晃动,大厦将倾了。
天然了,寰球也都知谈,AMD 除了 CPU,也作念显卡贸易的,中国官方网站下载关系词 AMD 的显卡 —— 也就是 GPU 业务,这两年过的则是。。。

其实在 2018 年之前,AMD 如故能跟英伟达掰掰手腕的。2006 年收购的 ATi(也就是如今 AMD 的图形部门),商场发挥一直透着一股 "神鬼二相性":神的时候王牌对王牌,旗舰卡致使能小胜英伟达;鬼的时候呢,旗舰卡只可对付和老黄的中端卡过过招。
可转化点,在于老黄的神之一手:2018年,老黄初始在破钞级 GPU 当中集成 RT Core 和 Tensor Core,而况同步推出了晴明跟踪和 DLSS 超分技能,如今这两项技能,每个臭打游戏的差友,应该都不会生疏。

可恰是这两项颠覆传统光栅化渲染的技能,让 AMD 一下子堕入了被迫:在这之后,两年后的 6000 系、四年后的 7000 系显卡,都没能拿出像样的光追和超分撑抓。
直到 2025 年 9000 系显卡的发布,AMD 才算有了可以的光追发挥。而 A 卡的超分超帧技能——FSR,早期更是用传统算法欺骗。FSR 能用,但后果跟 N 卡的 DLSS 差着一截。不异,直到跟着 9000 系一同推出的 FSR4,才是委果基于 AI 的超分技能,能和 DLSS 在画面发挥上掰掰手腕了。

换句话说,AMD 在图形技能方面,花了 7 年时刻才追上老黄的布局。
到了就业器端,剧情就更是寰球闇练的滋味了:对 AI 撑抓最佳、坐拥 CUDA 生态的 N 卡径直卖爆。AMD 这边确乎没老黄那么有前瞻性,对标 CUDA 的 ROCm 直到 2016 年才出现,万般算法的撑抓和优化功底,也没 CUDA 那么深厚。
总结下来就是:不管是光追、超分超帧,如故大模子期间的软硬件撑抓,又简略是硬件性能,AMD 的 GPU 确乎不是英伟达的敌手。

也正因如斯,很长一段时刻里,AMD 的 GPU 都是靠"性价比"这一招,吃着老黄看不上的订单。
而 AMD 保管性价比上风的措施其实挺绵薄:又不是什么芯片都得用 2nm 先进制程,更低廉的 4nm,致使 5nm 工艺其实也够用了嘛。
本钱更低,卖的天然也可以更低廉。
而倒有点“无心插柳”的嗅觉:跟着智能体引爆了商场对 CPU 和 GPU 的搀杂需求,AMD 随机是左口袋 CPU、右口袋 GPU,都能掏出东西来。

既然双方都能自研,那就可以整点不一样的花活了。于是,AMD 尝试偷师苹果,把更大范畴的 CPU 和 GPU 都塞进吞并块芯片,再把内存也整合进去。
AI Max+ 395 应时而生。这颗 U 在一颗芯片里,塞入了 16 核 CPU 和 40CU 的 “核显”,性能堪比独显的同期,又可以分享系统内存,用超大内存径直跑大模子。

仍是这个活唯一苹果颖慧,可一台大内存的 Mac Studio 动辄三五万,而一台 395 的小主机只消一万多。天然依旧未低廉,但关于那些重度使用大模子、同期又有隐自费心的小伙伴来说,这个价格其实……挺合算的。

天然了,AMD 如今的问题也不少。
就拿 AI Max+ 395来说,生态短板依旧昭着。托尼有共事一直用它跑土产货大模子:面临主流的 LLM 模子,AMD 的兼容性没啥问题;可一朝思试试图片简略视频生成模子,又简略思进行模子微调,就不好说了。
面临生态间隙,一方面 AMD 把 ROCm 开源,思要借社区的力量来完了对 CUDA 的"弯谈超车"。

另一方面,在此次 AMD AI 开拓者大会上,苏妈给出了一个更合适 AMD 的谜底——围绕性价比,构建一套属于我方的 AI 生态。

具体来说就是:开拓者可以在 AI Max+ 395 这类末端上快速完了思法,再用 AMD 显卡的职责站作念微调测试,终末在数据中心用 AMD GPU 完成出产部署。整套经过都跑在 AMD 的软件生态里,挪动起来天然顺畅得多。

表面归表面,践诺用起来若何样?
大会上给出了谜底:单台 AI Max+ 395 最大撑抓 128GB 长入内存,能把 Qwen 122B 模子跑在土产货;

4 台 395 互联,还能惩处更大更复杂的任务。同期,AMD 还告示了与魔搭社区的协作,每东谈主有 100 小时的云表算力体验时刻——好不好用,我方试试就知谈。

无论是拿下"过时"产能,在硬件上坚抓性价比;如故上个月限制的 AI 开拓者大会,如今 AMD 的各样看成,亦然在尝试打造属于我方的软硬件生态。
本年 AMD AI 开拓者大会,选在了对 AI 开源孝敬最大的中国,足以见得 AMD 对生态的嗜好。

当补皆生态这块最短的板之后,即使 AMD 顶着"逾期"工艺,性能也比不外的双重 Debuff,惟恐也能在商场杀出属于我方的一派天。
凤凰彩票APP


备案号: