聚焦
DeepSeek优化技术引发热议,工程师质疑英伟达CUDA护城河
时间:2025-01-31 11:02
DeepSeek-V3论文细节曝光,显示其绕过了英伟达的CUDA,使用更底层的PTX语言进行优化。
这一操作使DeepSeek-V3的硬件效率比Meta等高出10倍,通过修改GPU的流式多处理器实现服务器间通信,变相绕过硬件限制。
此消息引发工程师热议,有亚马逊工程师质疑CUDA是否仍为英伟达护城河,认为顶尖实验室能有效利用任何GPU。网友甚至开始畅想DeepSeek开源CUDA替代方案的可能性。
然而,需明确的是,PTX仍是英伟达GPU架构中的技术,作为CUDA编程模型的中间表示,连接高级语言代码和底层硬件指令。
DeepSeek使用PTX优化不意味着脱离CUDA生态,但代表其有优化其他GPU的能力。
此外,DeepSeek已与AMD、华为等团队紧密合作,提供对其他硬件生态的支持。同时,AI擅长编写汇编语言可能成为AI自我改进的方向,DeepSeek-R1已能编写显著提升大模型推理框架运行速度的代码。