聚焦
阿里巴巴通义千问挑战DeepSeek,低成本部署成亮点
时间:2025-03-11 17:58
近日,阿里巴巴AI模型“通义千问”(Qwen)加速追赶DeepSeek-R1。DeepSeek作为中国业界热门AI大模型,备受瞩目。而阿里巴巴则宣布未来三年将投入超3800亿元用于云端和AI硬件建设,创中国民企之最。
阿里巴巴最新发布的开源推论模型QwQ-32B,参数规模320亿,性能却比肩6710亿参数的DeepSeek-R1。
更引人注目的是,QwQ-32B的部署成本大幅降低,只需NVIDIA RTX 4090增强版即可,成本仅为DeepSeek-R1的十分之一。用户还可通过通义App免费体验该模型。
QwQ-32B的成功在于其高性价比,得益于阿里巴巴采用的不同技术路线——密集架构(Dense),而非DeepSeek的混合专家系统(MoE)。此外,阿里巴巴通义团队还进行了两轮大规模强化学习,提升了模型性能。
截至目前,通义千问的衍生模型数量已突破10万,成为全球最大开源模型族群。阿里巴巴正积极承接AI红利,拟在这一波竞赛中拔得头筹。
然而,尽管QwQ-32B性能强劲,但市场回馈仍需时间观望,LLM从“能用”到“好用”仍需实际应用检验。