週三的華爾街出現了一個奇特的「平行時空」現象。當整體科技股正歡欣鼓舞地往上衝刺時,記憶體族群卻像是看到了什麼可怕的利空,盤中全面崩跌。其中,美光科技(Micron)、威騰電子(Western Digital)與其旗下的 SanDisk 品牌、甚至傳統硬碟大廠希捷(Seagate)無一倖免,股價走勢一片慘綠。
而引爆這場記憶體大屠殺的罪魁禍首,不是經濟衰退,也不是同業倒貨,而是來自 Google 發表的一項全新軟體技術——「TurboQuant」壓縮演算法。
空間魔法降臨:AI 的「大胃王」體質被治癒了?
為什麼一個軟體演算法,可以把身經百戰的硬體大廠嚇出一身冷汗?這要從 AI 模型的「大胃王」本性說起。
現在的大型語言模型(LLM)越來越聰明,能處理的「上下文視窗(Context Window)」也越來越長。為了記住這些落落長的對話脈絡,AI 系統必須高度依賴一種名為「鍵值快取(KV cache)」的機制。你可以把它想像成 AI 在大腦裡的「短期記憶區」;當對話越長,這個記憶區需要的 DRAM 與高頻寬記憶體(HBM)容量就呈現幾何級數的暴增。這正是過去一年多來,記憶體族群能夠享受超高本益比、股價一飛衝天的核心邏輯。
然而,Google 這次祭出的 TurboQuant,堪稱是記憶體界的「空間魔法」。根據官方釋出的數據,這項技術能把龐大的 KV cache 強勢壓縮到僅剩 3-bit,最可怕的是:完全不需要重新訓練模型,且準確度幾乎不打折。
實測結果更是讓硬體廠看了心驚肉跳。TurboQuant 不僅將記憶體的使用量直接大砍了約 6 倍,在搭配輝達(Nvidia)H100 GPU 運作時,最高還能榨出高達 8 倍的效能提升。這意味著,原本 AI 伺服器必須插滿昂貴的高階記憶體才能跑得動的模型,現在靠著軟體瘦身,硬體需求可能大幅縮水。
華爾街多空論戰:需求毀滅 vs. 效率救贖
面對這項技術突破,華爾街分析師們立刻分成了兩派,展開激烈的多空論戰。
看空派:容量焦慮解除,硬體重估定價 富國銀行(Wells Fargo)TMT 產業分析師 Andrew Rocha 點出了市場最深層的恐懼。他指出,隨著 AI 模型不斷擴展上下文視窗,KV cache 已經成為推升硬體成本的最大瓶頸。如果 TurboQuant 這種「降維打擊」的壓縮技術成為業界標配,AI 企業對硬體的「容量焦慮」將大幅緩解。當客戶發現買 2 顆記憶體就能達到過去 10 顆的效果時,整體市場的容量需求勢必面臨重新評估,這對高度依賴量價齊揚的記憶體廠絕對是一記重拳。
看多派:算力依舊緊缺,拉回就是買點 不過,現在就宣判記憶體產業步入寒冬,恐怕還言之過早。Lynx Equity Strategies 分析師 KC Rajkumar 就顯得「老神在在」。他直言,現在的高階記憶體(特別是 HBM 產線)根本是「有錢也買不到」的極度緊繃狀態。
Rajkumar 認為,在未來 3 到 5 年內,這類先進壓縮技術的出現,與其說是「摧毀需求」,不如說是「提升整體 AI 運算效率的救贖」。更何況,科技界有個著名的「傑文斯悖論(Jevons Paradox)」:當某項資源的使用效率變高、成本大幅下降時,反而會激發出更多原本被高昂成本壓抑的新應用,最終導致總需求量不減反增。因此,他重申對美光科技的長期看好,認為這波恐慌性回檔,反而是長線投資人絕佳的佈局機會。
籌碼面的脆弱與後續觀察指標
整體而言,我們必須客觀看待這次的股價劇震。記憶體族群從去年底至今累積了極大的漲幅,許多個股都在歷史高位徘徊。在籌碼獲利了結的賣壓下,股價本就處於「高處不勝寒」的狀態,對於任何潛在的利空消息自然會產生放大反應。把軟體技術的進步直接等同於硬體需求的崩盤,在邏輯上確實有些過度簡化與恐慌。
對於投資人而言,與其隨著盤面殺低,不如冷靜緊盯以下兩大後續觀察方向:
-
技術普及的實際落地速度: TurboQuant 目前仍處於 Google 的技術展示階段。這套演算法是否會開源?其他雲端巨頭(如微軟、AWS)是否會迅速跟進採用類似架構?這將決定記憶體需求被壓縮的真實速度。
-
大廠的資本支出指引: 接下來美光、三星(Samsung)與 SK 海力士的財報會議將是重頭戲。密切留意高層對於明年 AI 伺服器記憶體搭載量的預測,以及擴產計畫是否有踩煞車的跡象。
硬體與軟體向來是科技發展的雙螺旋,互相牽制也互相推進。在這場由 Google 掀起的壓縮革命中,記憶體產業或許面臨短期的估值修正,但 AI 算力軍備競賽的終局之戰,絕對還沒畫下句點。