当前位置:主页 > 快讯 >

AI生成,哪家强?

时间:2025-08-29 16:56:36

  混元、智谱CogView-4、通义千问、即梦、可灵和Gemini 2.5 Flash Image。

  :人物的皮肤质感过于光滑,仅有微小瑕疵。

  :第一眼看上去很华丽,很有气势,但似乎理解出现了一些偏差。这并非一个由星云构成的生命体,而是一尊宇宙材质的宏伟雕像。

  :28.5分

  从效果上来看,千问、即梦、可灵和Gemini的文生图效果都是很不错的。

  尤其是前身为nano-Banana的Gemini 2.5 Flash Image,拿到了最高的分数,证明了它并非浪得虚名。

  不过,我们的核心目标还是要透过现象看本质。

  人们总是惊叹于AI的“创造力”,它足够以假乱真,绘画水平也超越了大部分人。

  但事实上,AI输出的AI作画,并非像一个画手一样,从一张白纸开始一笔一笔画出事物。

  而是从一张充满随机噪声点的“混沌画布”开始,根据提示词进行降噪。

  也就是说,

  对于苹果生成数量的错误,可能就是因为“构成一幅和谐的水果静物图”这个在训练数据中频繁出现的指令,其概率权重超过了“3”这个脆弱的数字符号。

  对于星云和狮子之间的挣扎,与“狮子”相关的像素模式可能是“实体”和“毛发”,而与“星云”相关的则是“气体”和“半透明”。AI无法同时满足两个相互矛盾的概率分布,因此降噪过程就无法成功。

  对于水墨风的机甲,则可能是AI背后的数据库在发挥作用。如果数据库中有大量“水墨”、“机甲”等高质量的标签,降噪过程也会被顺利引导至一个高质量的概率空间。

  简单的来说,

  至于错误,文生图是一个很复杂的过程,很遗憾,我们无法确切得知问题出在哪一环节。

  也因此,至少目前为止,

热点推荐
1 “宁王”原始股东减持不改机构乐观预期

一纸减持公告引发市场热议。本是资本市场见怪不怪的减持,但放在宁德时代这样的龙头身上...

2 Codex负责人重置全线付费用户频率限制,

消息,Codex工程负责人Thibault Sottiaux宣布,已重置所有付费计划的Codex频率限制,让已耗尽本周...

3 分析师:比特币引领加密ETF资金流入达

消息,上周加密ETF领域资金流入达12亿美元,过去四周总流入量为46亿美元,管理资产增长至...

4 马斯克诉OpenAI案陪审员选定,裁决仅供参

消息,马斯克诉OpenAI案的陪审团遴选已完成,从40名候选人中经过5小时问询选出9名陪审员。该...

5 马斯克用自家X平台付费推广Altman负面报道

消息,马斯克在诉OpenAI案开庭当天,通过自家X平台付费推广《纽约客》记者Ronan Farrow发布的...

6 Block发布2026年Q1储备证明,持有28355枚BT

Jack Dorsey的Block公司发布了其2026年第一季度的储备证明,显示其持有28,355枚比特币,所有交易均...

7 追涨杀跌巨鲸:brentoil空单新开仓42,868.

消息,据HyperInsight监测,链上巨鲸在brentoil上新开仓42,868.02枚,开仓价为102.32美元,当前币价同...

8 达利欧:美国经济已陷入滞胀环境

消息,桥水基金创始人达利欧在当地时间4月27日表示,通胀压力持续叠加经济增长放缓,政策...

9 GitHub Copilot6月1日起全线改按量计费,月费

消息,GitHub宣布所有Copilot计划将于6月1日起转为按量计费,原有的「高级请求」计费方式将被...

10 Bitget研究:比特币短期有望突破8万美元至

美国现货比特币ETF在4月23日前实现连续八天净流入,总额达到21亿美元,为2025年10月以来最长的...

成都来彰科技 蜀ICP备2025134723号-1

资讯来源互联网,如有版权问题请联系管理员删除。