就在昨天,美光、三星、西数这些平时稳如老狗的存储巨头们,集体懵圈了!
一供应链没断,二财报也问题,结果股价却全部来了个大跳水,你说冤不冤?

这几位老哥仔细一盘发现,好家伙,罪魁祸首原来是谷歌刚展示的一篇论文(将在下个月的 ICLR 2026 上正式发表)。

这篇论文到底写了啥?简单来说,他们搞出了一个名叫 TurboQuant 的全新压缩算法。
而它的作用也是相当简单粗暴:能把 AI 大模型推理时最吃内存的“KV Cache(键值缓存)”这块,生生压缩至少 6 倍,而且宣称“精度零损失”。

消息一出,市场纷纷将其解读为“以后跑 AI 对内存的需求将大幅降低”,于是存储巨头们先跌为敬……
那么情况到底怎么回事儿,这玩意儿是不是真有这么神,今天咱们就来好好跟大伙儿聊聊。

首先大家可能对 KV Cache 这个词有点陌生。简单科普一下,你可以把它理解为 AI 在跟你聊天时的“短期记忆草稿本”。
现在的大模型动不动就支持几十万字的长上下文,你想让 AI 记住前面聊了啥、不至于聊两句就精神分裂,就必须得把中间产生的海量数据临时存起来。
不过随着上下文越来越长,这本“草稿本”需要的物理内存空间也会呈指数级爆炸。

这也导致了一个很现实的问题:现在的 AI 大模型,算力往往不是瓶颈,内存反而是最大的累赘。
这就好比你大脑转得飞快,但手边做记录、标重点的草稿纸先用完了,直接能给你干憋屈。
为了省内存,以前业界也是想尽了办法,最常见的就是搞“量化”,简单来说把高精度的数据砍成低精度来描述,实现减轻内存压力的目的。

但这玩意儿治标不治本,不仅会损失 AI“智商”,很多时候还需要额外存一堆“量化常数”,一来二去,省下的空间又被吃回去了,主打一个瞎忙活。
而谷歌这次的 TurboQuant 路子很野,它直接用两招把额外开销干到了零。
第一招叫 PolarQuant(极坐标量化)。
看不懂也没关系,小忆尽量用大白话来讲哈。
以前 AI 记录数据都是用传统 X、Y、Z 坐标系描述的,比如描述一个具体位置需要标记“先向东走几个路口,再向北走几个路口”。

谷歌团队发现,这属实太费事了!于是直接换成“极坐标”来描述,变成了“朝多少度方向走几个路口”就行。
这么一改,不仅信息量一点没少,描述还变得更加简单紧凑,直接省掉了坐标系本身的大量额外开销。

而第二招就叫 QJL(量化 JL 变换)。
极坐标压缩完,可能难免会出现一些微小误差。这时候 TurboQuant 会甩出一个仅占 1 bit 的“补丁包”,专门用来做矫正,把那些偏离的误差强行拉回正轨。

这一套组合拳打下来,效果那叫一个炸裂:
官方表示,不需要任何额外的微调和训练,直接把庞大的键值缓存量化到了 3 bit,内存占用暴降 6 倍。
不止内存省了,处理还更快。
比如在英伟达 H100 显卡上,其处理速度狂飙了 8 倍!

当然最离谱的还得是,在超大规模长文本测试里,它的准确率居然是满分,实现了“精度零损失”。
注意这不是“接近满分”或者“几乎满分”,而是真正的“满分”,也就是说结果和未经过压缩的版本完全一致。
我直接好家伙,现实版“又让马儿跑,又让马儿不吃草”就这么上演了?

网上流传有一句话,这是 AI 圈的另一个“DeepSeek 时刻”,小忆觉得真没开玩笑。
以前大家为了跑大模型,只能疯狂砸钱买那些贵得离谱的高配显卡和海量内存。
现在谷歌这波操作直接摊牌不装了,甚至把牌桌都给掀了。
以后把数据压一压,原先的显存、内存能干以前 6 倍的活儿,这你受得了吗?

这对于整个 AI 行业来说,妥妥的是一颗深海炸弹,意味着长上下文 AI 推理的成本、对内存的需求,可能要迎来断崖式暴跌。
这也是为啥美股那帮存储大厂脸都绿了——一旦 AI 不需要那么多物理内存了,谁还来当冤大头啊?
不过,华尔街资本家亏不亏钱咱不管,这事儿对普通等等党来说,也无疑是个天大的好消息。
因为咱们捣鼓 PC 硬件、搞装机 DIY,内存条这块的预算压力可能真要有转机了。

而且往大了说,以前想在本地跑个稍微聪明点的大模型,动不动就得插满 64G 甚至 128G 内存,看着空瘪的钱包只能像个无能的丈夫一样哀叹。
但如果谷歌这技术真的落地普及,说不定 16G、32G 内存都能轻松在本地无损跑起百亿参数的 AI,想想就很刺激啊。
还更别提智驾汽车、手机这些对内存更加敏感的领域了。
总之,目前 TurboQuant 已经在开发者圈子里炸开了锅,各路大神都在疯狂尝试复现它的代码。

虽然要把这玩意儿完美融入现有的 AI 大基建可能还有一段路要走,但方向基本已经明确了。
以后不能老想着无脑堆硬件,而是要想尽办法降低硬件开销、提高效率。
谷歌这次也再次证明了,在堆硬件之外,极致的算法优化,依然有着一把掀翻桌子的可能。
啥也不说,静静等待这项技术真正实装的那一天吧。
说不定下一次新装机的时候,咱们的钱包就能实打实地省下一大笔钱了。
*资料、图片来源:Googel Research、网络。
本文编辑:@ 小忆
©本文著作权归电手所有,未经电手许可,不得转载使用。