0
本文作者:宇济 | 2025-07-04 10:09:51 |
文|白 鸽。数 。企业
生成式AI对国际的划落雕琢,在数据上表现得酣畅淋漓。地背的用
跟着AI大模型年代的面大模型到来,非结构化数据(图片、数音视频等)比重日益添加 。企业IDC数据显现 ,划落2025年非结构化数据现已占有整个已知数据的地背的用90%以上 。
为了让AI更好地辨认和了解这些数据 ,面大模型一场环绕数据的数“向量化”革新正在悄然打开 。
以最重要的企业查找场景为例,Data x AI年代企业的划落需求正在发生改动 。曩昔,地背的用查找只需求做好全文检索 、面大模型结构化查找分词等“要害词查找” ,但现在的用户需求现已变成了向量查找 、语义查找 、多模态混合查找等等,“猜你要搜”“图片查找”都成了常态。
举个最简略的比如,之前咱们手机相册找相片,不能用要害词查找 ,就算用户体会最好的苹果手机 ,也最多只能按“人脸辨认”的人物分类。但现在咱们都能够用要害词来寻觅相片 ,本质上,便是图片在数据层面,做到了“向量化”。
这个看似纤细的改动,却是在数据层面满意掀起一场巨浪的蝴蝶效应。
OceanBase(以下简称OB) CTO杨传辉以为 ,AI对数据库的改动正在呈现在两个方面:
Bring Data to Al :经过数据提高精确度 ,让大模型愈加精确 ,下降推理本钱;
Bring Al to Data:将AI集成到数据库,完结SOL+AI混合核算,发生化学反应。
数据不只影响着大模型功用,AI也在让数据库本身完结晋级。而数据库的AI才干晋级,也加快推进在RAG等场景中的运用落地。
这场双向改动的化学反应 ,让未来的数据库,成为一个一体化的智能数据底座 。
因而,本年5月,OB正式宣告面向AI年代的到来 ,要从一体化数据库转型成为“一体化 AI 数据底座”。而这次革新中,OB的云上数据库OB Cloud成为前锋军 。
究竟 ,云天然便是适配AI ,由于AI这种海量非结构化为主的数据,便是需求一个高传输 、低延时的反应,云上的分布式数据库更合适。
一个企业的AI转型,从查找增强开端。
“不知道怎样用AI,就先用常识库做一个Agent帮手。” 。
而做Agent帮手,就离不开离常识库最近的RAG(查找增强) 。所以近两年,RAG成了企业级AI落地开端的当地。
建立26年的零售科技公司伯俊科技 ,做AI转型时 ,第一个阶段建立的便是用RAG做的AI东西——AI通识帮手 。
为了不让这个AI帮手“上线即搁置”,伯俊科技中台事业部总监李昊说到,他们调研了整个公司,终究针对四大事务场景来打开功用设计 。
一是类似于传统企业常识库问答 ,首要面向出售端,依据过往企业堆集的数据,协助出售了解公司的规章准则 、产品的过往记载以及客户前史状况等;
二是针对后端人员 ,伯俊科技现已沉积了包含电商、线下零售、B2B等整个产品常识系统,依据AI小帮手的运用,能够让后端人员快速了解对应的常识系统;
三是针对技能才干,伯俊科技则依据现已沉积的一切不同产品线之间功用差异点,以及其聚集的客户画像等,能够便利后端同学快速把握这些中心信息,相同关于交给侧的作业人员,也能够快速上手,为其提高功率;
四则是针对运维同学 ,伯俊科技经过将客户过往的问题 ,包含进程中交流的QA,悉数以常识库的方法反哺给运维同学,极大的提高了客户运维的呼应时效性 ,提高客服服务体会 。
除此之外,企业也会跟着数据才干的深化,渐渐处理更多事务问题。“伯俊科技经过运用OB Cloud来处理了企业常识库沉积的问题,未来它还会将数据库的才干,逐步延伸至企业文件导购、AI配货才干等企业中心事务上。”。
事实上 ,在企业场景中,想要建立一个RAG场景,至少需求构建两个层面:
一个是底层的数据库渠道 ,包含向量数据库、文本数据库等,假如往杂乱里说,或许还需求地舆联络数据库