当前位置:主页 > 推荐 >

2025年,数据库迎来新一轮变革

时间:2025-07-04 19:48:52

  数据库,这个长期“藏在后台”的基础设施,正被AI时代推向台前。

  客服想更精准地回答用户问题,推荐系统希望更快做出响应,风控模型则需要更实时地识别风险——这些智能能力的背后,离不开数据库提供持续、结构化、具备上下文的数据支撑。

  “以前数据库是仓库,现在更像是中枢。”Databend CEO 张雁飞这样对产业家形容。

  与此同时,问题也随之而来。

  “原先的权限系统正在失效。”某上市企业数据安全产品部总经理陈宇耀对产业家直言。

  数据库,正在经历一次深层的升级。

  这一轮变化,对厂商、客户、产品、安全体系,都是一次重新洗牌。

  过去,数据库的核心职责是存储和查询,主要被用于记录订单、交易、库存等结构化数据。但随着AI模型进入客服、、推荐、分析等业务流程,数据库的角色正在发生变化。

  越来越多企业意识到,要让AI系统“理解业务”,必须让它获取实时的、结构化的数据上下文。而这些数据,大多存放在数据库中。数据库逐渐成为AI模型背后的信息源,也成为支撑企业自动化流程的关键基础设施。

  在增强生成、Agent系统、实时推荐等场景中,数据库被用于:存储模型调用所需的上下文信息,如用户历史、商品属性、产品知识;支持向量检索,用于语义、相似内容匹配;记录AI Agent的状态和决策流程,确保自动化行为可追踪、可回溯。

  以往是人操作系统时触发数据库查询,现在是模型或Agent自动生成请求。这些请求频率高、链路复杂、语义模糊,对数据库的性能和响应能力提出更高要求。

  多位数据库从业者跟产业家提到,客户正在要求数据库“不仅能存数据,还要能理解语义”。这意味着数据库需要支持更丰富的索引结构、更灵活的数据格式,以及与AI系统之间更高效的接口。

  “一个客户将数据库接入AI客服系统,每一次用户提问,模型都需要查询产品信息、用户偏好、订单状态等多个字段。过去一分钟调用几次数据库就足够,现在几秒钟可能就要处理上百次请求。”张雁飞告诉产业家。

  一些新应用需要同时处理结构化数据、非结构化数据、向量数据。数据库产品也开始集成更多原本由引擎、缓存系统、特征平台承担的功能。

  这种变化不只是企业需求上的提升,也带动数据库产品形态的演进。传统数据库的设计假设是“人操作系统”,现在则必须适应“AI操作系统”的需求。

  例如,PostgreSQL 社区涌现出多个兼容 LLM 的扩展模块;Databend 等云原生数仓则在底层集成向量与结构化数据的混合检索能力。

  尤其是 Databend,其优势在新一轮洗牌中愈发凸显。

  张雁飞告诉产业家:“我们并不是在给传统数据库加AI插件,而是在为AI生态造数据库。”

  在研发一线,这种变化也体现在团队讨论方式的转变。

  过去数据库团队主要关注写入性能、查询优化、事务一致性,现在越来越多话题围绕“模型能不能读得快、Agent调得稳、上下文能否持续更新”。

  数据库“走向前台”的转变,不只是性能优化的问题,更是一场架构重构和安全重塑的系统性挑战。

  在AI时代,数据库厂商面临的核心问题不再是单点能力的提升,而是如何适应更复杂、更动态的智能应用需求。

  过去,系统按“专一能力”划分——做事务处理就专注OLTP,做分析就服务于数据仓库。

  既要结构化查询,也要图谱检索、向量、流式处理,甚至希望能原生支持Prompt编排与自然语言接口。

  为了支撑AI系统复杂的调用链,数据库厂商正在底层架构上做出调整。例如,在索引体系中引入倒排索引、向量索引和混合检索模块;在查询引擎中兼容SQL与自然语言解析;在执行逻辑上牺牲部分一致性,以保证实时响应。

  张雁飞表示:“客户不关心数据库叫什么名字,他们关心的是,这个数据库能不能支撑AI系统实时运行。”

  但这让一些问题逐渐显现。

  一个事实是,尽管国内数据库厂商在OLTP与OLAP领域已有突破,但面对AI原生场景,依然存在架构短板。向量检索、多模融合、Agent友好型接口等新需求,对厂商的系统设计灵活性和技术积累提出更高要求。

  “我们一开始就以Serverless和云原生为基础,这才让我们有机会在底层集成向量和图谱等能力。”张雁飞坦言,“如果从关系型出发,中途再转,几乎不可能。”

  过去,安全重点是“防人出错”——通过权限配置、访问控制、加密等手段保护数据。但如今,数据库频繁被AI模型与Agent程序调用,这些系统具备“类人”的主动性,传统的权限体系正在失效。

  权限失控已不再是预警,而是现实问题。

  许多企业在部署AI系统时,忽略了对Agent行为的审计和限制。例如,在RAG系统中,若缺乏权限过滤,用户可能通过Prompt调取数据库中的敏感信息。

  更值得警惕的是,向量数据库还引入了新的安全风险:攻击者可能反推训练语料,或通过注入“污染数据”操控检索结果,进而影响模型输出。

  “我们已经看到一些攻击案例:在知识库中混入歪曲内容,让模型输出出现偏差。”陈宇耀告诉产业家,“传统的数据防泄漏系统在这里几乎无效,因为它无法识别语义层的攻击。”

  这也意味着,数据库安全的定义正在被重写。

  过去关注的是“存储安全”,而AI时代,更需要关注调用链路的可见性、访问行为的可解释性,以及上下文权限的动态调整能力。

  面对AI引发的结构重构与安全冲击,企业开始尝试通过“补能力、调权限、改架构”的方式应对,但这些尝试大多仍处在探索初期。

  企业希望数据库能原生支持文本、图像、向量等多模数据处理,减少对中间件的依赖。“客户越来越希望一个系统处理多种数据结构,而不是东拼西凑。”张雁飞直言。

  然而,从实际来看,这一能力尚未标准化。

  一些系统仅支持简单的向量相似度计算,难以胜任复杂语义检索;也有厂商虽引入向量模块,但与主查询引擎耦合度低,存在性能瓶颈与一致性问题。“数据库+向量”更多是“接上了”,距离“融合好用”仍有距离。

  与此同时,“上下文管理”机制也尚不成熟。当前多依赖缓存或临时表来提供上下文信息,缺乏一套高效统一的调用模型。多位业内人士坦言,目前尚无数据库在AI上下文支持方面形成行业共识。

  AI系统频繁调用数据库,但原有权限设计与审计机制并未同步升级。一些企业尝试通过Agent侧的访问白名单、上下文窗口等方式,限制其可访问字段范围。

  “以前权限是‘人对人’,现在得变成‘Agent对字段’。但很多企业甚至搞不清自己用了多少数据库调用、有哪些Agent在跑。”陈宇耀说道。

  虽然部分企业已引入运行时加密、动态权限调整、审计网关等机制,但这些组件多为外挂,无法与数据库主系统统一策略、协同运行,反而增加了系统复杂度。

  更大的问题在于,大多数数据库并不具备原生的“身份链路”和“行为路径”可视能力。AI调用链路层层嵌套、日志分散,企业即使发现风险事件,也难以准确追溯全过程。

  部分企业选择将敏感数据保留在本地,仅在云端运行非核心AI任务;也有企业部署数据库一体机,封闭Agent接口以强化管控。

  “一家金融客户把Agent的访问范围限制在每日自动销毁的只读表内,虽然安全,但代价是灵活性和实时性大打折扣。”张雁飞说。

  当前,混合部署与权限隔离是相对可行的务实策略,但也带来数据同步压力、接口维护成本高、系统响应延迟等一系列副作用。而要真正实现“安全与效率兼顾”,企业还需在数据库引擎层构建具备策略调度能力的原生机制,目前这一能力尚属空白。

  更现实的问题是,即使某些数据库在功能上实现替代,仍可能在复杂SQL优化、多模协同、Agent状态一致性等细节上出现不稳定。这种技术缺口导致AI应用在测试阶段表现良好,但一旦接入真实业务流量,常常暴露出查询卡顿、语义漂移、权限错配等问题。

  “AI改变了数据库的角色,但技术体系还没跟上。”一位制造企业CIO对产业家直言,公司目前采用的是“加一层、补一段、设几个限”的方案。

  他还说:“这听起来安全,其实只是感觉安全。”

  目前,业界普遍认为,AI时代的数据库将沿着三个方向持续演进:一体化、智能化、安全内生化。

  具体来看,

  过去,企业往往需要部署多个数据库来分别处理结构化、日志、向量或图谱数据。这不仅造成架构冗余,还带来数据同步、权限治理和审计合规的额外负担。

  “未来的数据库,应该能统一处理结构化、文档、图数据和向量数据,并提供一致的查询接口与权限体系。”Databend CEO 张雁飞表示,“我们希望把过去五个工具才能完成的任务,压缩成一个产品来实现。”

  然而,这种一体化仍面临技术挑战。

  不同数据类型在存储格式、索引结构、查询语义上差异显著,要在同一引擎内高效支持并不容易。目前多数所谓的“融合型数据库”,仍是关系型架构上外挂功能模块,缺乏真正的底层融合。

  AI正倒逼数据库“前台化”,同时也成为其自身能力升级的关键工具。目前,已有厂商借助大模型生成SQL、构造测试用例、优化查询计划,大幅提升开发与运维效率。

  “我们已经用AI自动生成上万组查询语句,覆盖各种业务场景,这在人力时代几乎不可能。”张雁飞指出,未来数据库优化器的演进也将依赖大模型,“AI会成为数据库研发流程中的标配工具。”

  但“懂AI”还不够,数据库必须“适配AI”,解决上下文管理、Agent状态维护、调用路径压缩等新场景问题。目前,行业尚缺乏统一的接口规范和调用语义标准,数据库之间的协同能力仍有壁垒。

  AI应用对数据访问模式的改变,使“外挂式安全”逐渐失效。频繁自动化调用、行为不透明、权限动态变化,要求数据库具备原生的权限管理、行为审计、访问透明和运行时加密等能力。

  “权限系统不能只是配置文件或外置引擎,它必须嵌入数据库核心逻辑。”陈宇耀指出。真正“安全内生”的数据库,应深度融合身份体系、行为模型与策略引擎,为AI调用提供全过程可控的信任机制。

  值得注意的是,这场变革也为新兴玩家提供了窗口。传统数据库厂商架构包袱沉重、演进缓慢,而一些新项目则从AI场景出发,绕过旧范式,直接构建面向Agent、向量与上下文的底层逻辑。

  “AI对数据库的重构,不是插件升级或功能扩展,而是理念转变——从存储转向协同,从记录转向参与。”张雁飞强调。

  当然,这一进化仍在进行中。一体化架构仍在调试,智能能力受限于应用场景,安全机制尚未标准化落地。要真正成为AI系统的“实时引擎”,数据库还需穿越长坡厚雪。

热点推荐
1 美国财长贝森特:哈塞特和其他人一样都

消息,美国财长贝森特表示,对美国白宫国家经济委员会主任哈塞特的任何担忧都是荒谬的,...

2 《富爸爸穷爸爸》作者清崎打破沉默,谈

罗伯特清崎将美联储近期的降息解读为新一轮量化宽松政策的前兆,并警告称这将引发通货膨...

3 以太坊10分钟内涨超3%,暂报2977美元

消息,12 月 17 日,据 HTX 行情数据,以太坊 10 分钟内涨超 3%,暂报 2977 美元,市值升至 3487....

4 华尔街巨头DTCC选择专注于隐私的区块链

在近期收到美国证券交易委员会的无异议函后,DTCC与Canton Network达成合作,将部分美国国债代...

5 美联储理事沃勒:利率水平比中性利率高

消息,美联储理事沃勒表示,利率水平比中性利率高出 50 到 100 个基点。美联储可以以适度的...

6 又见“大肉签”!沐曦股份开盘首日收涨

以12月17日收盘价来看,N沐曦-U的收盘价已超本月新上市的摩尔线程-U,跻身至A股第三位。前两...

7 分析:Robinhood 股价大幅跑赢标普 500,机

Robinhood 股价在 2025 年表现远超标普 500 指数,截至目前累计涨幅约 200% 以上,显著跑赢大盘表...

8 Messari:Sei Q3活跃用户同比增长近翻倍,

12月17日消息,据Messari报告,Sei Network 2025年Q3日均活跃地址增长93.5%至82.4万,日均交易量达20...

9 币安悬赏500万美元举报欺诈性代币“上币

币安发布透明度更新,警告各项目方提防欺诈的第三方上币代理,并强调所有上币申请必须通...

10 一笔价值 260,387,071 美元的奇怪比特币转账

一笔涉及 3,000 枚比特币的大额交易被转入一个与 Matrixport 基础设施关联的币安充值地址。Ark...

成都来彰科技 蜀ICP备2025134723号-1

资讯来源互联网,如有版权问题请联系管理员删除。