当前位置:主页 > 聚焦 >

DeepSeek多模态技术报告:教模型「用手指点着想」,迷宫导航超GPT

时间:2026-05-01 08:39:02

  消息,DeepSeek发布了多模态推理技术报告「thinking with visual primitives」,提出了一种新推理范式:模型在思考时像人用手指点东西一样,把坐标直接穿插在思维链里,锁定每一个涉及的视觉对象。该项目在GitHub上开源,采用MIT许可。当前多模态模型的一个核心瓶颈是「指代鸿沟」,模型能看清图片,但推理时只能用自然语言描述视觉对象,场景复杂时定位困难。DeepSeek通过将边界框和点坐标变成推理的最小单元,解决了这一问题。模型基于v4-flash架构,视觉token压缩极端,测试结果显示在多个基准测试中表现优异,尤其在拓扑推理和迷宫导航任务上大幅领先其他模型。

热点推荐
1 BTC OG内幕巨鲸:BTC巨鲸多单浮亏收窄至

消息,某BTC巨鲸的多单浮亏已从1496万美元收窄至1296万美元。该巨鲸的均价为76,117.30美元,目前...

2 分析师:欧盟MICA过渡期将于7月1日结束,

消息,欧盟的MICA过渡期将于2026年7月1日结束,届时仍未获得批准的加密交易所、经纪商和钱包...

3 光韵达成立智算科技公司,含多项AI业务

消息,光韵达近日在深圳成立了光韵达智算科技有限公司,经营范围包括大数据服务、互联网...

4 4000枚BTC转入PayPal相关地址,价值约2.62亿

消息,据Whale Alert监测,今日19:08,4000枚BTC从未知钱包地址转入PayPal相关地址,按实时价格计算...

5 链上分析师AI姨:某巨鲸追加质押4549.5万

消息,据链上分析师AI姨监测,某巨鲸从币安提取4549.5万枚USDT,质押进AAVE并借出1万枚ETH卖空。...

6 世界杯德国7

消息,2026年世界杯小组赛中,德国队以7-1大胜库拉索队,荷兰队与日本队2-2奉献精彩进球大战...

7 英法德意四国称将解除对伊朗制裁

消息,英国、法国、德国和意大利发表联合声明称,在美国和伊朗达成结束战争的协议后,各...

8 链上分析师余烬:胜率90%的巨鲸做空1.7万

消息,据链上分析师余烬监测,胜率90%的巨鲸在两小时前ETH上涨后以1717.8美元的价格做空1.7万...

9 普京与特朗普通话数小时后,基辅遭无人

消息,包括基辅在内的乌克兰城市在周一早些时候遭到俄罗斯无人机和导弹袭击,数小时前普...

10 Pi42首席执行官:加密市场与全球市场的互

消息,Pi42首席执行官Avinash Shekhar在接受Coinpedia采访时表示,加密市场与全球市场的互联已完成...

成都来彰科技 蜀ICP备2025134723号-1

资讯来源互联网,如有版权问题请联系管理员删除。