、百度为代表的国内互联网云厂商正在加大AI投入,此外,中国移动、中国电信、中国联通等运营商也在加码算力基础设施投资。
IDC 数据显示,2024年中国加速服务器市场规模达到221亿美元,同比2023年增长134%。IDC 预期2029年中国加速服务器市场规模将达到1000亿美元。
几天前,深度求索正式发布DeepSeek-V3.1。其中一个引人关注的进展是支持UE8M0 FP8。深度求索在官方
半导体资深专家、电子创新网创始人张国斌向
事实上,业内对低精度量化的共识正在形成。
壁仞科技研究院也指出,针对大模型规模的不断扩大,存在一种简单的方法,能够同时有效应对计算量大、储存不足和数据传输慢这三个问题,也就是模型低精度量化。其作用为将模型的权重和中间变量进行低精度截断,从而大幅压缩数据量,并利用硬件中专门的低精度矩阵乘法处理器来加速计算。目前,硬件上已逐渐开始支持各种低精度的格式以及对应的低精度矩阵乘法计算。
张国斌进一步指出,关于国产芯片支持FP8精度,是因为原生支持FP8精度可以使国产芯片在AI计算领域更具竞争力,缩小与国际旗舰产品在性能上的差距,更好地满足国内日益增长的AI应用需求,为国产芯片在市场中赢得更多份额,也可以减少对国外芯片的依赖。
尽管如此,DeepSeek并未明确指出FP8究竟适配哪家国产AI芯片。市场因此将目光投向了8月13日中国信通院发布的首批DeepSeek大模型适配名单。名单显示,中国电信、华为、寒武纪、昆仑芯、海光、沐曦、中昊芯英、中科加禾等8家企业通过了相关测试。
从财报披露的信息来看,寒武纪已持续扩展支持DeepSeek、Qwen、Hunyuan等系列模型,并重点优化通信与计算的并行性能,以提升混合专家模型的整体训练吞吐率。
在硬件之外,寒武纪也在模仿英伟达的CUDA路径,尝试通过软硬件协同建立生态壁垒。
CUDA是英伟达自2007年起构建的并行计算平台与编程模型,为开发者提供了涵盖训练、推理的工具链、库与调优方法,成为英伟达护城河的重要组成部分。
与之相比,寒武纪 Cambricon NeuWare 整合了训练和推理的全部底层软件栈、各种库和编程语言,让开发者可以快速实现项目开发,高效利用芯片算力,有效提升了公司产品的竞争力。
财报显示,报告期内,寒武纪向上交所提交2025年度向特定对象发行A股的申报材料,拟募资不超过39.85亿元,其中20.54亿元将投入大模型芯片平台,14.52亿元投向大模型软件平台。寒武纪在公告中强调,将构建面向大模型的软件平台,进一步提升公司软件生态的开放性和易用性。
SpaceX与美国AI初创公司Reflection签署了一项算力协议,交易金额最高可达63亿美元。...
2 比特币价格分析:2026年6月最佳投资选择2026年6月,比特币目前在64,000美元中间区间整固,此前经历了本月初的急剧回调。近期价格走势...
3 CryptoQuant分析师称比特币期货杠杆率在6月消息,据CryptoQuant分析师指出,6月份市场回调后,比特币期货杠杆率显著重置,未平仓合约下...
4 MEV机器人攻击引发Taiko桥警报消息,今日加密市场关注以太坊安全,因攻击者袭击了jaredfromsubway.ETH和Taiko桥系统。此次事件...
5 Bybit Alpha、Byreal现已上线ARX与MU交易消息,Bybit Alpha和Byreal现已上线ARX与MU交易。ARX是Solana生态的AI基础设施项目代币,而MU则对应热...
6 Sharplink签署协议募资7500万美元,用于增加消息,纳斯达克上市公司Sharplink签署证券购买协议,通过出售1001.34万股普通股及认股权证募集...
7 英格兰银行放宽稳定币规则,取消个人持消息,英格兰银行宣布放宽稳定币规则,取消个人持有上限,并为系统性稳定币发行者设定4...
8 bittensor联创const:协议尚未完全去中心化消息,吴说获悉,bittensor联创const表示,bittensor目前尚未实现完全去中心化,核心升级与发展方...
9 比特币ETF赎回压力减轻,另一个阻力却在消息,随着交易者在美国假期后重返市场,比特币现货ETF在过去一周又损失了2.28亿美元的赎回...
10 预计美联储将在2026年9月、10月和12月各加消息,美国银行:预计美联储将在2026年9月、10月和12月各加息25个基点,之前的预测是今年利率...
成都来彰科技 蜀ICP备2025134723号-1
资讯来源互联网,如有版权问题请联系管理员删除。