当前位置:主页 > 业界 >

让大模型「分工读写」:英伟达双塔架构TwoTower并联两座30B模型,无损换取2.4倍提速

时间:2026-07-02 16:37:57

  消息,英伟达推出双塔架构,并联两座30B模型,实现无损换取2.4倍的生成速度提升。该架构旨在解决大模型生成速度瓶颈,采用双塔解耦设计,冻结自回归大模型作为「只读上下文塔」,并单独训练「去噪写字塔」,通过交叉注意力读取上下文信息。写字塔采用「置信度去掩码」机制,优先写下高置信度词,逐步填补剩余空白。在30B级别的混合架构模型上,该设计仅用1/12的数据量进行适配,保留了98.7%的质量,并将生成速度提升2.42倍。

热点推荐
1 AI论文首发站arXiv宣布独立运营,与康奈尔

消息,AI论文首发站arXiv宣布独立运营,正式结束在康奈尔大学长达25年的托管生涯,成为独立...

2 让大模型「分工读写」:英伟达双塔架构

消息,英伟达推出双塔架构,并联两座30B模型,实现无损换取2.4倍的生成速度提升。该架构旨...

3 KuCoin将下架XEM和NRN代币

消息,KuCoin宣布将于2026年7月2日08:00下架两种项目代币XEM和NRN。下架后,用户在灵活储蓄中的本...

4 Bitget上线TENCENTUSDT、XIAOMIUSDT等7只股票永续

消息,Bitget宣布已于2026年7月2日上线TENCENTUSDT、XIAOMIUSDT、SMICUSDT、POPMARTUSDT等7只股票的永续合约...

5 Forward Industries在2026财年第三季度增持50万

消息,Forward Industries宣布在2026财年第三季度增持超过500,000枚SOL,现持有总量达755万枚SOL。该公...

6 Hashkey Capital推出行业首支比特币算力基金

消息,Hashkey Capital宣布拟推出行业首支比特币算力基金,由比特。该产品将面向全球专业投资...

7 迈克尔·伯里:加码做空AI相关资产,称韩

消息,迈克尔伯里在《华尔街日报》上表示,他正在加码做空与AI相关的资产,包括特斯拉、卡...

8 黑石ETH ETF 7月1日净流入22638枚ETH,价值约

消息,黑石在7月1日的以太坊ETF净流入22638枚ETH,按当前价格计算约合3664万美元,交易量达到...

9 链上分析师AI姨:某交易者多单连亏326万

消息,据链上分析师AI姨监测,地址0xa2ef1468在多单连亏4笔累计亏损326万美元后,于今日凌晨转...

10 Paolo Ardoino:欧盟MICA法规对稳定币非常危

Tether首席执行官Paolo Ardoino解释了USDT未申请欧盟MICA牌照的原因,称该法规对稳定币非常危险。...

成都来彰科技 蜀ICP备2025134723号-1

资讯来源互联网,如有版权问题请联系管理员删除。