热点
独家!四川DeepSeek布局又进一步,3月将上线DeepSeek架构护理教培大模型
今年3月,天府绛溪实验室将上线基于DeepSeek大模型为底层架构的护理教培垂类大模型。
天府绛溪实验室先进计算前沿研究中心主任陈惠在接受
一是“怎么用DeepSeek”。基于一站式服务,企业可以在这个平台上生产出各种专用的智能体。二是“专业用DeepSeek”。基于模型蒸馏量化服务,让每个四川企业都可以拥有自己的模型。三是“怎么建DeepSeek”。基于“智能计算适配验证测评中心”,测评主流软硬件适配,帮助用户进行选型参考。
据陈惠介绍,“DeepSeek协同创新计划”共涉及六项行业服务,分别是模型算力适配测试服务、模型运行支持服务、私有化部署服务、私有模型训练服务、模型蒸馏服务、智能体模型工厂及智能体底座服务。
其中,模型算力适配测试服务旨在助力用户精准地进行算力选型。在这一过程中,天府绛溪实验室与中国信息通信研究院共建“智能计算适配验证测评中心”,使用的测评工具和数据集历经大量实践检验,评估维度全面且细致。
模型运行支持服务可以针对现有应用,帮助用户便捷地切换至所提供的DeepSeek模型API服务。特别对于川内用户,该服务在时延响应方面表现出色,能够有效避免排队等待的情况发生。同时,在全量模型服务方面,用户可依据自身需求自由切换,进而验证并确定最优选择。
考虑到部分用户的数据具有高度敏感性,因此该计划推出私有化部署服务。陈惠表示,该项服务能够将整体服务能力高效迁移至客户的数据中心,充分保障用户数据的安全性与服务的高效性。
另外,私有模型训练服务能够帮助用户参考DeepSeek的模型训练方法,以快速、低成本的方式训练出具有行业垂直属性的大模型。其目的是使每个企业能够更加轻松地运用开放的人工智能技术,从而显著提升生产力,推动各行业的智能化发展进程。
模型蒸馏服务则可以帮助用户降低模型运行过程中的算力需求。与此同时,还能有效保持模型的性能表现,甚至能够在笔记本电脑上实现流畅运行,极大地提升了模型的实用性和便捷性。
智能体模型工厂及智能体底座服务还能够助力用户在DeepSeek模型的基础上快速构建属于自己的AI智能体。该智能体具备强大的业务适配性,可与办公、财务、生产制造、客服、设计等业务应用系统实现融合。
在“DeepSeek协同创新计划”推进过程中,不同行业和规模的企业如何选择适配的服务备受关注。天府绛溪实验室先进计算前沿研究中心建议企业采取“三步走”策略。
第一步是需求诊断。通过深入调研明确业务目标与使用场景,如边缘端场景一般1.5B规格模型即可,面向企业整体统一服务则需671B模型。第二步是场景分级。数据敏感、业务复杂的大型机构更适合私有化部署加定制调优,中小型企业或创新团队可选用轻量化API与一站式模型部署服务,降低使用门槛和成本。第三步是渐进式接入。初期用容器或裸金属资源形式验证方案可行性,中后期随业务发展拓展至多节点、集群甚至混合云服务方案,灵活支撑业务增长。
护理教培垂类大模型预计3月发布
自去年起,天府绛溪实验室便积极投身于多个行业领域。以医疗行业作为典型示例,目前该实验室正与华西医院紧密协作,共同致力于打造护理教培大模型。
“在这一过程中,华西医院各专科充分发挥其专业优势,提供了海量的护理数据以及宝贵的专家知识,而实验室则依托自身强大的算力资源以及先进的智能体模型工厂,有序推动模型训练工作的开展。”陈惠说道。
在具体技术方面,天府绛溪实验室通过应用细粒度MoE架构,有效解决了多学科知识协作的调度问题;借助思维链技术,攻克了医疗专业知识精准推理的难题;运用模型蒸馏技术,化解了模型运行对算力需求的高要求。
“这些技术手段的综合应用,不仅大幅加速了模型训练的进程,还显著提升了模型的性能,最终成功构建出一款行业垂直大模型,其成本与使用门槛大幅降低,真正实现了每个护士都能够便捷使用。”陈惠表示。
据了解,在初步测试阶段,该模型便展现出了良好的效果。该模型上线后将逐步攻克传统护理教培工作中长期存在的诸多难点,例如护士基础水平难以精准掌握、带教老师任务负担过重、教学过程缺乏有效手段、课本知识与实践操作相互背离、考核评估过于主观等问题,有力地推动护理教培工作成效与质量的全面提升,为全川范围内各医院护理能力的快速跃升提供强大助力。
据陈惠透露,这款护理教培垂直大模型,选用DeepSeek大模型作为底层架构,目前该项目正稳步推进,按规划将于今年3月正式发布首个版本。