动态

谷歌发布Titans系列AI模型架构

时间：2025-01-21 19:40

　　近日，谷歌研究院宣布推出“Titans”系列模型架构。这一架构的最大亮点在于其独特的“仿生设计”，巧妙地融合了短期记忆、长期记忆和注意力机制，从而实现了对超过200万个Token的上下文长度的支持。

　　在当前业界，Transformer模型架构虽然表现出色，但其上下文窗口长度的限制却成为制约其进一步发展的瓶颈。面对长文本或多轮对话等场景，Transformer往往难以保持语义连贯性和信息准确性。而谷歌Titans系列模型架构的推出，正是为了解决这一难题。

　　Titans系列模型架构的设计灵感来源于人类的记忆系统，通过引入深度神经长期记忆模块（Neural Long-Term Memory Module），实现了短期记忆与长期记忆的有机结合。同时，注意力机制的引入更是让模型能够着重执行当前的上下文，确保用户即时输入的提示词能够得到准确处理，而以往提示词的记忆也不会丢失。

　　值得注意的是，Titans系列模型架构还提供了三种不同的架构设计变体，分别是Memory as a Context（MAC）、Memory as a Gate（MAG）和Memory as a Layer（MAL）。这三种变体分别适用于不同的任务需求，可以根据实际情况灵活选择。

　　其中，MAC架构变体将长期记忆作为上下文的一部分，适合处理需要详细历史上下文的任务；MAG架构变体则根据任务需求调整实时数据与历史信息的重要性比例，专注于当前最相关的信息；而MAL架构变体则将记忆模块设计为深度网络的一层，实现了高效的信息压缩和处理，虽然输出效果略逊于MAC和MAG变体，但在效率上更具优势。

上一篇：中国台湾南部强震，触发台积电紧急疏散措施
下一篇：iPhone SE 4爆料：灵动岛设计来袭

兴中资讯

兴中资讯

动态

谷歌发布Titans系列AI模型架构