当前位置:主页 > 头条 >

罗福莉解密MiMo降本底牌:预填充注意力计算量降至10层全局GQA级别

时间:2026-05-27 22:46:08

  消息,罗福莉在X平台公布了自研大模型MiMo-v2.5系列实施API永久性降价后的算法降本机制。她透露,在API价格对齐DeepSeek后,小米的高负载推理引擎仍能保持盈亏平衡,成本降低主要来自混合注意力架构与层次化KV缓存优化。针对缓存命中成本降低99%的设计目标,小米推理框架实现了针对滑动窗口注意力SWA的层次化KV缓存优化,生产测试显示,层次化优化将缓存的token容量提升至5倍,降低了80%的缓存成本。罗福莉表示,低成本的推理服务有利于激发终端智能需求,大模型企业应当避免盲目的价格战,通过算法与推理系统的底层协同设计,将实际运行开销控制在盈亏平衡线以下。

热点推荐
1 ETHWomen将于7月22日在多伦多举办,聚焦女

消息,ETHWomen将于2026年7月22日在多伦多举行,汇聚来自Web3和AI行业的女性,作为加拿大加密周...

2 美联储理事:稳定币等数字资产影响美元

美联储理事Christopher Waller在第五届美元国际角色会议开幕致辞中表示,今年会议将讨论稳定币...

3 比特币波动率看起来便宜,10亿美元期权

消息,随着周五105亿美元季度期权到期临近,比特币当前价格为62,344.19美元的波动率显得相对...

4 Bitget恢复BANK

消息,Bitget宣布现已开放BANK - Binance Smart Chain网络的充值服务。对于暂停期间给您带来的不便,...

5 伊朗称将继续追究参与侵略伊朗者的责任

消息,据伊朗方面23日消息,伊朗外交部发言人巴加埃当天表示,某些中东地区国家参与美国和...

6 某巨鲸通过TWAP策略分批卖出DRAM多单,获

消息,某巨鲸地址在5小时前通过TWAP策略分批卖出了价值300万美元的XYZ:DRAM多单。链上数据显示...

7 巨鲸0x913开设3814万美元SOL空头头寸

消息,据onchain lens数据,巨鲸地址0x913在过去24小时内开设了554,680枚SOL的20倍空头头寸,价值约...

8 鲸鱼出售1100枚ETH,获利4100万美元

一只鲸鱼在沉寂7年后开始出售以太坊。截至目前,该鲸鱼已出售1100枚ETH,获得约190万美元,累...

9 XRP现货ETF在6月22日实现净流入

消息,6月22日,XRP现货ETF实现净流入531万美元,而BTC和ETH现货ETF则分别出现净流出,BTC净流出...

10 Ripple获得卢森堡加密资产服务提供商牌照

消息,Ripple获得卢森堡金融监管局颁发的加密资产服务提供商牌照初步批准,该批准旨在推进...

成都来彰科技 蜀ICP备2025134723号-1

资讯来源互联网,如有版权问题请联系管理员删除。