首页
资讯
娱乐
新闻
旅游
汽车
电影
栏目分类

资讯

你的位置:买球·(中国)投注APP官方网站 > 资讯 > 买球·(中国)投注APP官方网站很快便在存储市集激励了剧烈颠簸-买球·(中国)投注APP官方网站

买球·(中国)投注APP官方网站很快便在存储市集激励了剧烈颠簸-买球·(中国)投注APP官方网站

发布日期:2026-04-12 06:30    点击次数:95

买球·(中国)投注APP官方网站很快便在存储市集激励了剧烈颠簸-买球·(中国)投注APP官方网站

【本文由小黑盒作家@大荒星坠落于04月07日发布,转载请表明出处!】

近日,谷歌筹商院发布了一项名为TurboQuant 的全新AI内存压缩本事,很快便在存储市集激励了剧烈颠簸,导致天下存储芯片板块出现权贵着落。并被Cloudflare 的 CEO Matthew Prince 称为这是谷歌的 “DeepSeek 时期”。

这项本事旨在处罚大谈话模子在运转时濒临的“键值缓存”(KV Cache)内存瓶颈问题。

简便来说,当AI模子处理信息、生成文本时,需要多量高速内存来存储临时的诡计截止(即KV缓存),这曾是AI处事器“吃”内存的主要原因之一。

而TurboQuant本事简略在不亏欠模子准确率的前提下,将这部老实存的占用量压缩至原本的六分之一,同期在英伟达H100 GPU上终了最高8倍的性能加快。

因为 TurboQuant 极地面裁减了内存占用,畴前用户的手机或轻浮条记本,即便内存不大,也能土产货通顺运转参数很大、才气很强的 AI 模子。而厂商也不再需要为了跑 AI 而大肆堆砌超大内存,确立资本可能裁减,或者在同等价钱下给用户更好的其他竖立。

此外,因为这项本事极度处罚了“键值缓存”(KV Cache)的瓶颈,这意味着 AI 能“记取”更长的高下文。畴前用户的 AI 助手可能记起住其几个月前说过的细节,或者能帮其顷刻间读完并回归几十万字的演义/法律文档,而不会“读了后头忘前边”。

总的来说,这项本事关于统统这个词 AI 行业来说,犹如一颗参预深海的炸弹,它预示着长高下文AI推理的资本以及对内存的需求可能会急剧下降。以后东说念主们不需要大肆砸钱买腾贵硬件,就能让 AI 记取更长、更复杂的信息。

现在,谷歌尚未表明何时将这项本事用到自家的 Gemini等模子上买球·(中国)投注APP官方网站,这还仅仅一项学术遵守,接洽鄙人月的ICLR会议上认真发表。