动态
谷歌发布Titans系列AI模型架构
时间:2025-01-21 19:40
近日,谷歌研究院宣布推出“Titans”系列模型架构。这一架构的最大亮点在于其独特的“仿生设计”,巧妙地融合了短期记忆、长期记忆和注意力机制,从而实现了对超过200万个Token的上下文长度的支持。
在当前业界,Transformer模型架构虽然表现出色,但其上下文窗口长度的限制却成为制约其进一步发展的瓶颈。面对长文本或多轮对话等场景,Transformer往往难以保持语义连贯性和信息准确性。而谷歌Titans系列模型架构的推出,正是为了解决这一难题。
Titans系列模型架构的设计灵感来源于人类的记忆系统,通过引入深度神经长期记忆模块(Neural Long-Term Memory Module),实现了短期记忆与长期记忆的有机结合。同时,注意力机制的引入更是让模型能够着重执行当前的上下文,确保用户即时输入的提示词能够得到准确处理,而以往提示词的记忆也不会丢失。
值得注意的是,Titans系列模型架构还提供了三种不同的架构设计变体,分别是Memory as a Context(MAC)、Memory as a Gate(MAG)和Memory as a Layer(MAL)。这三种变体分别适用于不同的任务需求,可以根据实际情况灵活选择。
其中,MAC架构变体将长期记忆作为上下文的一部分,适合处理需要详细历史上下文的任务;MAG架构变体则根据任务需求调整实时数据与历史信息的重要性比例,专注于当前最相关的信息;而MAL架构变体则将记忆模块设计为深度网络的一层,实现了高效的信息压缩和处理,虽然输出效果略逊于MAC和MAG变体,但在效率上更具优势。