AMD放出狠话:内存条可能要被时代淘汰了

把内存当成显存用,本地就能跑百亿参数大语言模型的时代可能真的要来了!

没错,就在前几天,AMD 的高级副总裁 David McAfee 在接受采访时,整出了一个大新闻。


图片


他公开表示:统一内存架构Unified Memory Architecture,缩写为UMA)正在迅速崛起,这玩意儿开启了无限可能,并且将深刻影响 AMD 未来的产品和路线图

David McAfee 暗示,甚至连未来的桌面级 CPU,都将用上它。


图片


而看热闹不嫌事大的苏妈,最近也给隔壁刚刚发布 RTX Spark CPU(采用了统一内存架构)的黄仁勋点了个赞。

大意就是:老黄啊,你总算跟上了我的步伐,说明我的 Halo 系列统一架构思路是完全正确的!

图片

等等,这时候肯定有资深电友要举手了:“统一内存架构(UMA)?这不就是我们用了十几年的核显偷系统内存的换皮话术吗?怎么现在成大厂集体追捧的未来黑科技了?

别急,今天小忆就带大家来扒一扒,看看这个让苹果尝到甜头、让老黄连夜入局、让苏妈直呼 Yes 统一内存架构,到底是个什么神仙玩意儿。

大家肯定也好奇,它又是怎么从当年不太起眼的一个低端技术,变成如今的香饽饽的。

图片

要理解统一内存,得先看看以前我们是怎么用电脑的。

CPU(处理器)、GPU(显卡)、RAM(内存),大家都知道他们是干啥用的了。传统电脑里,这哥仨是相互独立的模块,各干各的各司其职。

图片

当你要玩个 3A 大作或者跑个 AI 模型时,CPU 得先把数据从硬盘加载到内存里,然后通过一条叫 PCIe 的高速通道,把数据再复制到显卡显存里。

图片

GPU 处理完了,完事儿还得再通过这条通道把结果运回来……

这种架构不光来回折腾费事儿,还要受到内存速率、PCIe 带宽等影响,可以说效率是比较低下的。

何况你内存里存了一份数据,显存里还得复制一份一模一样的,其实这也是一种资源浪费。

图片

而所谓的统一内存架构,相当于直接把这套繁琐的流程给大幅简化了。

CPUGPU、内存这三大件不分家了,而是彻底凑在一起搭伙儿过日子。

它们直接被集成在了一起,原本 GPU 里面的独立显存也砍了,现在和 CPU 共用一套高带宽的内存

这样没有复制,没有传输,更没有中间商转差价!

GPU 想用数据,直接从统一内存中读就行,CPU 也是直接从里面拿 GPU 处理完的数据,延迟超低,效率那是嘎嘎提升。

图片

不过,正如前面提到,其实统一内存不是什么新概念,你的手机 SoC(骁龙、苹果 A 系列)天天都在用。

但在高性能 PC 领域,大厂们以前是不屑一顾的。那为什么到了 2026 年,大家突然开始疯狂卷这个赛道了?

原因很简单:还是我们说了无数次的那个 AI

图片

传统显卡什么都好,就是显存太贵、容量太小

你想跑一个上百亿甚至更高参数的本地大语言模型?不好意思,哪怕买了消费级顶级的 RTX 5090,区区 32GB 显存,可能连模型的屁股都塞不下。

这时候统一内存的恐怖优势就体现出来了!

首先,在统一内存架构下,内存有多大,显存就能有多大。


图片


苹果的 M3 Ultra 动辄能支持 96GB 甚至 512GB 的统一内存。

隔壁老黄最新发布的 NVIDIA RTX Spark,同样把 20 核的 Grace CPU 6144 CUDA 核心的 Blackwell GPU NVLink 缝在了一起,同时还塞入了 128GB 的统一内存!

图片

这就意味着,你可以在一台轻薄本上,本地直接跑上百 GB 的超大 3D 渲染场景,或者无压力运行大模型

这要换成传统显卡,你得在家里串联好几张昂贵的专业卡才能做到。

图片

其次,统一内存的带宽优势也是非常明显。

以前核显共享系统内存被骂垃圾,主要还是因为内存带宽太差了,比如主流双通道 DDR4 也就 50-60GB/s,双通道 DDR5 也就 80-100GB/s 左右。

这跟显存的动辄几百 GB/s 甚至 1TB/s 相比,确实太拉胯了。

但今时不同往日,现在的统一内存,大厂们直接用上了高宽带的 LPDDR5X 甚至是把 HBM 给封装了进去。

还是拿苹果 M3 Ultra 为例,内存带宽最高达到了 819GB/sNVIDIA 刚发布的 RTX Spark 也有接近 300GB/s


图片


有了这两项最明显的优势加持,统一内存架构能在 AI 时代吃香也就丝毫不奇怪了。

目前关于统一内存的大乱斗,基本已经形成三足鼎立。

苹果是最早把这玩意在 PC 端玩出花的,从 M1 到现在的 M4 系列,主打一个只要我内存和带宽足够,核显都能硬剪 8K 视频。

老黄这次和联发科合作带来的 NVIDIA RTX Spark,大家也看到了,全是狠活儿确实很顶。

图片

至于 AMD,其 Halo 系列已经全面投入统一内存架构怀抱。

虽然苏妈嘴上说着老黄学我,但身体很诚实,他们即将推出的次世代移动 APU(代号 Strix Halo,可能命名为锐龙 AI Max 400 系列)就是奔着这个去的,最高支持 192GB 的统一内存

图片

而且 David McAfee 这次的表态更激进:AMD 未来桌面级 CPU 也要评估这个架构。

如果成真,今后的 DIY 市场可能真的要迎来一次大洗牌了。

但是吧,看到这儿,小忆还是要给大家泼一瓢冷水。

细心的同学已经发现了,统一内存架构显然是和我们主流 DIY 模块化相冲突的

图片

既然 CPU GPU 要共享超高带宽的内存,那这内存就必须离芯片足够近,甚至直接封装在同一个基板上

这就意味着,传统的插拔式内存条在统一内存架构里将不复存在

图片

比如说你用个两年想从 64G 升级 128G,或者暂时手头紧先买个 16G 过渡后面再升级,对不起,只能整个重买

如果连选内存的权利和定价权都交给了芯片厂商,那最后估计会把我们这些消费者当成韭菜狠狠收割。

图片

不可否认,统一内存架构大概率会是未来几年硬件发展的必然趋势。

它用效率、带宽和容量,确实硬生生打破了以往的常规,给 AI 时代注入了无限可能。

只是这个代价嘛,可能对我们普通消费者来说略微有些沉重。

那么如果是你,你会选择继续坚持传统 DIY,还是加入统一内存新家庭呢?

*资料、图片来源:wccftech、AMD、NVIDIA网络。


本文编辑:@ 小忆

©本文著作权归电手所有,未经电手许可,不得转载使用。