推荐
阿里巴巴开源R1-Omni AI模型,具备更强的推理和理解能力
时间:2025-03-14 10:47
阿里巴巴通义实验室宣布开源R1-Omni模型,该模型能识别影片中人物情绪。R1-Omni是HumanOmni的升级版,具备更强的推理和理解能力。
通过详细分析人物的衣着、发型、脸部表情、谈线-Omni能预测角色传达的最明显情绪。
这是通义首次将强化学习与可验证奖励机制应用于多模态大型语言模型。
研究人员利用该技术优化R1-Omni的推理能力、情绪识别准确度及泛化能力,使其在处理新数据时仍能保持良好表现。目前,R1-Omni已在Hugging Face上开放免费下载。
阿里巴巴加速在AI领域的布局,此前已与深度求索进行基准测试,并与苹果达成合作。阿里巴巴集团CEO吴泳铭表示,通用人工智能是首要目标,而让AI具备情商是迈向该目标的关键一步。