首页 XM 在线交易市场新闻 【XM在线交易】谷歌研究发表压缩演算法TurboQuant 节省AI模型对记忆体消耗美股 US Stocks Quote - 外围新闻内容 Golbal News Content
2026-03-29 10:39:04

【XM在线交易】谷歌研究发表压缩演算法TurboQuant 节省AI模型对记忆体消耗美股 US Stocks Quote - 外围新闻内容 Golbal News Content

外媒报道,谷歌研究(Google Research)周二(24日)发表无需预先训练的压缩演算法TurboQuant,能在不影响模型精准度下,将大语言模型(LLM)的KV快取量压缩至3位元。在英伟达(NVDA.US)H100图像处理器(GPU)的基准测试中,相较於未量化的32位元键值,4位元的TurboQuant在计算注意力逻辑值(attention logits)时的效能提升最高可达8倍,同时将KV快取记忆体减少至少6倍。

KV快取用於储存先前计算出的注意力资料,使大语言模型无需在每个标记生成步骤中重新计算。随着上下文视窗不断扩大,这些快取正逐渐成为主要记忆体樽颈。虽然传统向量量化方法能缩小快取规模,但由於必须将量化常数与压缩资料一同储存,每个值会产生几位元小量记忆体开销。在更大上下文视窗下,这些开销会随之累积。TurboQuant算法则消除有关樽颈。

记忆体股Sandisk(SDNK.US)及美光(MU.US)隔晚(25日)分别跌3.5%及3.4%。(fc/j)(美股为即时串流报价; OTC市场股票除外,资料延迟最少15分钟。)

AASTOCKS新闻

相关推荐文章

【XM在线交易】芯片股惨遭抛售!指数重挫逾10%,市值蒸发超1万亿美元美股 US Stocks Quote - 外围新闻内容 Golbal News Content

2026-06-07

【XM在线交易】特朗普AI备忘录料纾缓五角大楼与Anthropic争议美股 US Stocks Quote - 外围新闻内容 Golbal News Content

2026-06-07

【XM在线交易】Trump 承诺在燃料及化肥成本上升下为农民提供纾困美股 US Stocks Quote - 外围新闻内容 Golbal News Content

2026-06-07

【XM在线交易】强生胜诉 此前有诉讼指控其滑石粉导致三名女性患癌美股 US Stocks Quote - 外围新闻内容 Golbal News Content

2026-06-07

【XM在线交易】小鹏被传机器人核心人物离职,内部人士称业务进展顺利美股 US Stocks Quote - 外围新闻内容 Golbal News Content

2026-06-07

【XM在线交易】瑞幸咖啡“去冰”到手仅半杯?客服:空余量会补齐,以门店实际制作为准美股 US Stocks Quote - 外围新闻内容 Golbal News Content

2026-06-07