人工智能打破了RAM内存经济

Galliano 说得对。在他的书《无法治理的机器》中,为了对互联网的使用和消费应用某种理性,Alejandro Galliano 提出了一个人类最终必须面对的现实:互联网,尽管看起来无限,但是有限的;它的资源也是有限的。也就是说,目前的互联网基础设施有一个物理极限,尽管看起来不像:某个连接速度、某个数据处理量、某个带宽、某个存储容量。总之,这些是构成网络物理部分的一般参数。它的极限。

互联网的稀缺性:Galliano 论文

Galliano 的解决方案,与他的马克思主义思想一致,是限制互联网的无意义使用:理性化,设定配额。虽然论证的这一部分从未完全令我信服,但在"互联网稀缺性"这个想法中有相当真实的东西。确实,互联网基础设施有一个物理极限,但同时它也有一个经济极限:一个需要无限资源才能运作的公司在什么时刻会停止盈利?Galliano 试图预测作为可能的互联网过度需求(数据)的症状,如今更多地表现为计算能力的过度需求。让我们看一下。

任何人在最后一轮以太坊挖矿热潮中试图购买显卡都知道我在说什么。在疫情的最后阶段,用普通 GPU 挖以太坊对许多人来说变得有利可图,这产生了一个泡沫:GPU 价格飙升,分配给以太坊的计算能力指数增长。当以太坊放弃工作证明(proof of work)机制并转向权益证明(proof of stake)时,GPU 挖矿不再有利可图,需求崩溃。这个周期似乎即将重演:需求高峰、稀缺和天价。但这次不是显卡(GPU),而是 RAM 内存

Galliano 不仅在他的书中澄清了这一点,还在《Sherpas》的这一集中讲述了它,这是El gato y la caja 的播客,以及我们在这一年中分享的至少三场讲座中的两场。我与他的论点的唯一区别是,在当前的生产方式中,由过度需求引起的瓶颈不是通过理性化解决的,而是通过价格上升。这,当然,最终是一种市场理性化方式。问题是,在当前资本主义模式中总是发生的事情:拥有更多资源的人是会收获最多的人。

RAM 供所有提前购买的人使用

RAM 内存稀缺和持续的价格上升既不是市场异常,也不是供应链的暂时事故。它们是工业重组的直接后果。AI,特别是 LLM,引入了一个优先考虑内存而不是几乎任何其他资源的工作负载。训练和推理不断移动大量数据,需要极端的带宽和持续可用性。在这种情况下,内存不再是便宜的商品,而成为了战略性投入。

LLM 是内存受限的系统:它们的性能不是那么依赖于纯粹的计算,而是依赖于尽可能快地移动大量数据的能力。这个技术细节是理解为什么瓶颈不在 CPU 甚至不在 GPU,而在为它们供电的内存的关键。

La memoria como la nueva vedette de la computación doméstica
内存是家用计算的新宠儿

DRAM 系列内——所有现代内存的基础——存在具有非常不同功能的不同类型。DDR5 是经典的系统内存,针对容量和合理延迟进行了优化,为个人电脑、传统服务器和通用用途而设计。VRAM,以 GDDR 的形式,优先考虑带宽来为 GPU 提供动力,牺牲延迟和容量可扩展性。然后是HBM,高带宽内存,它不是简单的"更快的 RAM",而是一种不同的架构:垂直堆叠的芯片、超宽总线和与高性能加速器的直接集成。

HBM 是现代 AI 需要的内存。不是因为任性,而是因为技术要求。在没有 HBM 的情况下训练和服务巨大的模型实际上是不可行的。问题是 HBM 和 DDR5 竞争相同的工厂、相同的工业流程和相同的资本。当制造 HBM 的利润远高得多,而数据中心客户支付的费用没有太多限制时,制造商的决定是显而易见的:优先考虑 HBM,将消费者内存降级。

结果是一个驱逐效应。不是因为不能生产 RAM,而是因为它失去了战略优先级。个人电脑、游戏机和家用硬件成为了工业重组围绕 AI 重新调整供应的附带损害。目前的稀缺性不是系统中的错误,而是饱和的信号。它标志着单一类别的工作负载主导工业规划并为所有人重新定义价格的时刻。Galliano 说得对。

影响是不可避免的

根据路透社发布的内容,该行业的三大公司正在分析其生产的变化。韩国巨头三星、SK 海力士和美光科技正在重组他们的业务。显然,由于计算需求和他们获得的持续资本投机注入,AI 公司处于市场主导地位,可以改变生产过程���符合他们的利益。如果韩国公司确认这一过渡以优先考虑 HBM 内存,消费者 RAM 内存市场将是一场噩梦。价格上升的报告是家常便饭。甚至投机性的动作已经开始了:供应商想要提前一个市场,高价购买,增加稀缺性。

公众使用的每台计算机都有 RAM 内存。电话、游戏机、笔记本电脑。我们是否走向一个内存比去年少的市场?消费者计算的价格会飙升吗?这是我们从421 开始预测的一些策略,以避免毫无防备地进入这个场景。Luis Paz 对台式电脑的赞美现在的价值比发布时高 10 倍。Soldán 的"计算寡头"概念也是如此,除了每次我读到它时都会觉得有趣,因为我想象一个胖子黑帮老大类型的 Kingpin 被内存和显卡包围。

我还要加上另外两个问题,这些问题是我从在 X 上阅读几个美国用户时收集的。如果这场危机持续超过几年,就像一切似乎表明的那样,我们会进入一个计算能力集中在大型数据中心的模式,没有人再拥有像家里那样的计算机,而是通过流媒体租赁该处理吗?我们是否走向几年前尝试用失败的云服务创建的租赁模式?

正如推文所说:如果 PS3 可以用仅仅 512 MB 的内存运行 GTA V 级别的游戏,而现在 Google Chrome 的一个标签页消耗 1.2 GB,在优化级别上究竟发生了什么?当 RAM 是一个相对不起眼的便宜内存时,���乎没有人太感兴趣优化其使用。这种趋势会改变吗?我们会因新的稀缺性而重新优化软件性能吗?

不管怎样,看起来2026 年将迎来更贵、功能更弱的计算机对普通用户来说。计算市场变得越来越复杂,危机以更短的时间间隔变得循环性的,联网社会的物理极限已经显而易见。Galliano 说得对。

Related posts

Suscribite