当前位置:主页 > 业界 >

硬件多模态交互开发套件,客户产品交互频次70% 创新场景

时间:2025-09-08 10:15:37

  场景描述

  随着AI能力进步,越来越多的传统硬件厂商以及基于小模型AI能力构建的智能硬件厂商,迫切得需要升级到大模型以提升交互体验。然而,对于众多企业来说要想保障低延时交互的同时,又要确保模型的效果并且引入外部服务丰富AI能力,还要兼顾成本就变得尤为挑战。

  众所周知,想要低时延则模型尺寸不能过大,而模型尺寸偏小又会带来效果问题;想要引入更多的外部服务来丰富AI能力,则工程链路必然更复杂,工程链路的冗长又会带来高时延问题。

  面对这些挑战,众多硬件厂商急需一种兼顾成本、时延、功能、效果并且易用的解决方案。

  解决方案

  阿里通义实验室,深刻认识到消费电子行业升级AI能力的紧迫性和重要性,为了解决上述挑战,决定建设多模态交互方案。

  该方案借助通义实验室的应用算法能力,对AI硬件的常见场景进行了分析,专项定制了数个小尺寸意图识别模型,在确保效果的同时最大程度降低时延。另外依托于阿里云百炼平台的生态,使得用户可以灵活自主得添加各类接口、MCP、智能体,极大程度得扩展了应用的能力边界。而且在阿里云自研算力的加持下,保障了性能和稳定的前提下让成本可控。使其最终成为硬件厂商用得起、用得好的解决方案。

  成效

  面向消费电子产品,提供结合了意图识别、安全审核、长期记忆、联网、Function call与Agent灵活插拔的语音、视觉多模态实时交互的一站式解决方案:

  1. 低延时,语音对线s,流对线. 丰富的内置技能与Agent
3. 从上下文到备忘录到长期记忆的多级记忆,记忆召回F1值90%以上
4. 意图识别模型准确率95%的前提下时延低于200ms

  阿里云为听力熊、希沃、深励科技等厂商提供的多模态交互解决方案使得其多款产品的AI体验大幅度提升,无论是情感陪伴、学习教育、语音控制、视觉理解都赢得了最终用户的好评和赞誉,用户粘性大幅提升,产品使用时长和交互频次分别提升20%和70%。

热点推荐
1 让大模型「分工读写」:英伟达双塔架构

消息,英伟达推出双塔架构,并联两座30B模型,实现无损换取2.4倍的生成速度提升。该架构旨...

2 KuCoin将下架XEM和NRN代币

消息,KuCoin宣布将于2026年7月2日08:00下架两种项目代币XEM和NRN。下架后,用户在灵活储蓄中的本...

3 Bitget上线TENCENTUSDT、XIAOMIUSDT等7只股票永续

消息,Bitget宣布已于2026年7月2日上线TENCENTUSDT、XIAOMIUSDT、SMICUSDT、POPMARTUSDT等7只股票的永续合约...

4 Forward Industries在2026财年第三季度增持50万

消息,Forward Industries宣布在2026财年第三季度增持超过500,000枚SOL,现持有总量达755万枚SOL。该公...

5 Hashkey Capital推出行业首支比特币算力基金

消息,Hashkey Capital宣布拟推出行业首支比特币算力基金,由比特。该产品将面向全球专业投资...

6 迈克尔·伯里:加码做空AI相关资产,称韩

消息,迈克尔伯里在《华尔街日报》上表示,他正在加码做空与AI相关的资产,包括特斯拉、卡...

7 黑石ETH ETF 7月1日净流入22638枚ETH,价值约

消息,黑石在7月1日的以太坊ETF净流入22638枚ETH,按当前价格计算约合3664万美元,交易量达到...

8 链上分析师AI姨:某交易者多单连亏326万

消息,据链上分析师AI姨监测,地址0xa2ef1468在多单连亏4笔累计亏损326万美元后,于今日凌晨转...

9 Paolo Ardoino:欧盟MICA法规对稳定币非常危

Tether首席执行官Paolo Ardoino解释了USDT未申请欧盟MICA牌照的原因,称该法规对稳定币非常危险。...

10 链上期权市场交易量创历史新高,Polyma

消息,据castle labs报告,链上期权市场正在从早期复制Deribit转向收益产品、RFQ/CLOB、短周期二元...

成都来彰科技 蜀ICP备2025134723号-1

资讯来源互联网,如有版权问题请联系管理员删除。