快讯
AIGC行业周报 英伟达全面开源GPU内核驱动;OpenAI发布GPT-4o min
一、市场企业动态
英伟达官宣全面开源GPU内核驱动,两年前已开始相关举措,此次开源部分驱动代码仍在主线内核之外。
新产品和旗舰平台支持开源GPU内核模块,旧版GPU不支持,开源可让开发者改进驱动程序并增加功能。
网友认为英伟达开源有多种动因,包括应对内核修改、被合作伙伴敦促等,其真正在意的是增长的市场。
李飞飞创办的World Labs短短3个多月成为估值10亿美元的AI独角兽,并获1亿投资。
World Labs瞄准空间智能理念,旨在教导算法具备常识,克服技术局限性。
李飞飞在计算机视觉领域成果斐然,其理念注重将AI训练得以人为本。
Proof News调查发现Anthropic、英伟达、苹果等硅谷巨头使用YouTube字幕训练AI,创YouTube数据被视为“金矿”,但AI公司使用这些数据引发了EleutherAI创建的YouTube字幕数据集引发争议,谷歌表示采取行动防止未经授权的数据抓取行为。
二、产品技术动态
OpenAI深夜发布GPT-4o mini,性能更强、更便宜,GPT-3.5退场。
GPT-4o mini在各方面表现出色,性价比极高,将扩展AI应用范围。
GPT-4o mini的谷歌对Gemini进行功能升级,使其能在Android设备锁定状态下回答各种提问。
此前Gemini功能局限,提问某些问题需解锁手机,现在新增了免提体验功能。
用户偏好设置页面新增“Gemini在锁屏状态”选项,该功能刚推出不久。
Mistral AI发布了专注于数学推理的7B大模型Mathstral,能解决高级数学问题。
同时发布的Codestral Mamba模型使用Mamba2架构,用于代码生成,在基准测试中表现优异。
两个模型均遵循Apache 2.0 license开源协议,模型权重可在HuggingFace上获取。
Anthropic发布安卓版Claude应用,功能强大,轻量且反响不错。
Claude安卓版具有多语言处理、图像分析等功能,旨在扩大用户群,挑战OpenAI。
未来人工智能助手在移动设备上的竞争将更激烈,关键在于技术创新和消费者信任的平衡。
北大发布Prompt自动增强系统PAS,可自动增强Prompt,提升大模型性能,超越SOTA。
PAS通过数据收集、生成和微调等步骤实现,能集成到不同LLMs中,且在实验中表现优异。
PAS减少了数据消耗,具有高效性和灵活性,人工评估也显示其在多个场景中优于基线模型。
快手开源LivePortrait,能将驱动的表情、姿态迁移到人像上,在全网快速“走红”。
LivePortrait基于隐式关键点框架,采用高质量训练数据和混合训练策略,模型训练分为两阶段。
LivePortrait已在快手诸多业务落地,并将探索多模态驱动的人像生成,持续为用户创造价值。
OpenAI被曝出新项目“草莓”,能提前计划、自主浏览网页和进行深度研究,推理能力显著提高,疑似已达AGI L2级别。
“草莓”包括“后训练”等特殊方法,OpenAI希望其能显著提高AI模型的推理能力,并具备执行长时间任务等能力。
OpenAI最近展示了GPT-4o等模型的新演示,若加上“草莓”的推理能力,离AGI的实现或将更近。
三、前沿观点
被誉为“生成式人工智能之父”的Schmidhuber认为Schmidhuber认为“深度学习三巨头”Schmidhuber认为未来将出现自我、自我改进的机器文明,同时强调了研究过往论文对年轻科学家的重要性。