消息,ME News 消息,3 月 13 日,近日,作者 karpathy 宣布其项目 nanochat 的训练效率得到显著提升。目前,在单个配备 8 个 H100 GPU 的节点上,训练一个达到 GPT-2 能力水平的模型仅需 2 小时,相比一个月前所需的约 3 小时有所缩短。作者表示,这一提升主要归功于将训练数据集从 FineWeb-edu 切换为 NVIDIA ClimbMix。他曾尝试 Olmo、FineWeb、DCLM 等数据集,但都导致性能下降,而 ClimbMix 则开箱即用,效果很好。此外,作者透露已成功设置 AI 代理来自动迭代优化 nanochat。在最近约 12 小时内,该代理在功能分支上进行了 110 次修改,将 d12 模型的验证损失从 0.862415 降至 0.858039,且未增加实际耗时。作者表示,过去约两周他更多地在优化“元设置”,而非直接修改 nanochat 代码库。
消息,MEXC 已完成 TAIX 代币 1:1 合约置换,新合约地址已更新。平台将于 2026 年 3 月 13 日 16:0...
2 新加坡科技投资公司 MetaComp 完成由阿里巴总部位于新加坡的Web 2.5支付和财富管理平台MetaComp在三个月内完成两轮融资,共筹集3500万美元...
3 nanochat 项目训练效率提升,单个节点 2 小消息,ME News 消息,3 月 13 日,近日,作者 karpathy 宣布其项目 nanochat 的训练效率得到显著提升...
4 PyTorch 介绍 NVIDIA NeMo AutoModel 训练库消息,ME News 消息,3 月 13 日,近日,PyTorch 官方社交媒体账号发布信息,介绍了 NVIDIA NeMo Au...
5 美国证券交易委员会(SEC)顾问小组支持美国证券交易委员会的一个咨询委员会建议该机构制定一项针对代币化证券的政策,允许绕过...
6 特朗普表情包团队推出第二轮盛大推广活TRUMP 代币背后的团队将于 4 月 25 日在海湖庄园为持有该代币数量排名前 297 位的用户举办一场...
7 Rumble 与 Tether 钱包的合作以及加密货币打Rumble Inc.公布2025年第四季度业绩,销售额为2707万美元,净亏损3269万美元;全年业绩预计为销售...
8 7103.04万美元BTC转入Coinbase机构消息,据Whale Alert发推称:1009 枚 BTC从一未知钱包转入 Coinbase Institutional。...
9 Bitmine以6189万美元购入3万枚ETH消息,据Onchain Lens发推称:Bitmine 从 FalconX 购入 3 万枚 ETH,价值约 6189 万美元。...
10 伊朗国家媒体:哈梅内伊的妻子还活着3月13日消息,据伊朗国家媒体:伊朗已故最高领袖哈梅内伊的妻子还活着,有关她死亡的报道...
成都来彰科技 蜀ICP备2025134723号-1
资讯来源互联网,如有版权问题请联系管理员删除。