中国AI公司惊艳全球,数据库榜单双料冠军,打破世界纪录!

9月26号那天,圈子里真的炸了。一条消息,就跟扔进平静湖面的一块巨石似的,同时在AI圈和金融圈掀起了滔天巨浪。说的是蚂蚁数科,对,就是那家中国的AI公司,在一个叫BIRD-Bench的测试里,把所有人都干趴下了。

这可不是什么野鸡榜单,这玩意儿是全球公认的,在自然语言转SQL这个领域里,难度堪称地狱级别。AT&T、谷歌、腾讯、阿里……你能想到的国内外顶级神仙,全都在榜上,但全都被蚂蚁甩在了身后。执行准确率81.67,执行效率77,双料第一。

这事儿一出来,各种解读满天飞。有人说得特别玄乎,说这是全球金融AI的“成人礼”,标志着AI从一个只会听指令、被动回答问题的乖学生,猛地一下,进化成了能“主动思考”的学霸。

但就在大家围着这份榜单,激动地讨论着AI是不是真的学会“思考”了的时候,很多人可能没注意到,或者说没把这两件事联系起来,就在半个月前,大洋彼岸,一场更凶猛、更直接的资本海啸,早就已经登陆了。

9月10号,甲骨文,就是那个我们印象里有点“上古时代”感觉的数据库巨头,股价一天之内,疯涨了36%,市值飙了2400多亿美元。为什么?就因为它跟OpenAI签了个单子。一份长达五年,总价值高达3000亿美元的算力大单。

你看,这事儿是不是特别有意思。一边,是应用层一个惊天动地的突破,我们欢呼AI终于变得更“聪明”了;另一边,是基础层一场毫不讲理的资本狂欢,钱像潮水一样涌向了那些给AI“卖水、卖铲子”的人。AI这盘棋,远比我们看到的要复杂,也……要疯狂得多。

很多人可能还是觉得,不就是一个测试嘛,至于这么激动?嗨,那你可能真没搞懂这个榜单有多硬核。BIRD-Bench这东西,它压根不跟你玩虚的,不考什么理论知识。它直接把AI扔到最真实的业务场景里,让业务员用最朴素的“大白话”提需求,比如“帮我查查上个季度华东区那个卖得最好的理财产品的客户里,有多少是30岁以下并且是第一次购买的”,然后,AI就得立刻把这堆绕来绕去的话,翻译成计算机能读懂、能执行的SQL代码。

这还不算完。它考的不是某个特定行业,而是横跨金融、医疗、教育等足足37个行业,数据库里塞了上万条这种九曲十八弯的复杂查询,数据量更是堆到了33GB。这难度,你说它是全球天花板,一点都不过分。所以,蚂蚁数科能在这拔得头筹,真正说明的不是别的,而是它的模型,已经有了在现实世界错综复杂的业务迷宫里,进行“深度思考”的可靠性。

这太重要了。因为一直以来,AI想要真正落地,心里头都悬着两大“心魔”。现在的大模型,你跟它聊天,个个都显得聪明绝顶,上知天文下知地理。可一到真刀真枪干活的时候,两个致命问题就暴露了。一个是“幻觉”,说白了,就是一本正经地胡说八道,你问它个事儿,它能面不改色心不跳地给你编造信息。另一个,是藏在数据深处的偏见,这更可怕,因为它悄无声息,却能导致AI做出失之毫厘、谬以千里的判断。

你想想,这要是在金融里,得多恐怖。一个风控模型,就因为某种看不见的偏见,把一个信用记录良好的优质客户的贷款申请给拒了。或者一个投研模型,给你分析市场头头是道,结果引用的关键数据,是它自己“捏造”出来的。这后果,谁承担得起?

蚂蚁数-科给出的解药,其实听起来很朴实。就两招:第一,自己从头到脚干,构建全栈的AI能力;第二,别想着包打天下,一头扎进一个垂直场景里,往死里磕。

去年5月,他们搞出来一个叫Agentar的智能体开发平台。这玩意儿说白了,就是一个AI应用的“乐高工厂”,从最底层的算力、模型,到中间的开发工具,再到最上层的应用,全给你配齐了。金融机构想做什么AI应用,不用从零开始,直接在上面像“搭积木”一样,快速拼一个出来。他们跟上海银行合作的那个“AI手机银行”就是这么来的,用户现在办业务、问理财,动动嘴就行,据说业务效率直接提了10%。

这种玩法,其实也印证了一个大趋势:整个行业对AI的期待,正在变。大家慢慢地从看热闹,看谁家的模型技术更“炫”,转向了看门道,看谁家的AI能真正带来“价值”。蚂蚁数科的CEO赵闻飙有句话,我觉得说得特别到位:“AI的价值不在于解决1000个浅层问题,而在于攻克一个行业深层痛点。”

所以你看他们的策略就很清晰,不跟风去卷那个什么都懂一点,但什么都不精通的通用大模型。而是把所有力气,都砸在金融这个垂直行业里,专门去啃那些最硬的骨头。据说现在,他们的解决方案已经覆盖了所有国有大行和超过六成的商业银行。AI,终于从一个花里胡哨的辅助工具,开始变成真正驱动业务的核心引擎了。

但就在蚂蚁这些应用层的玩家高歌猛进的时候,一个我们平时看不见的战场——数据基础设施,正在发生一场地壳级别的剧烈运动。甲骨文的“死而复生”,就是最响亮的一声号角。这位上个时代的大象,凭什么能再次起舞?就凭它在所有人还没反应过来的时候,就疯狂押注了云基础设施和AI服务。

AI时代,算力就是石油。全球各地都在拼了命地建数据中心,甲骨文也早就把英伟达的芯片资源死死攥在了手里。有报道说,光是今年,它就给英伟达下了一张400亿美元的GPU订单。当大多数人还在讨论AI能做什么的时候,真正赚得盆满钵满的,是这些给AI淘金热“卖水、卖铲子”的人。

这股风,当然也吹到了国内。

千行百业都在加速搞AI,而Agent,这个能让AI动起来的“智能体”,成了最好的落地方式。今年,全球Agent市场规模已经冲破了50亿美元。但很多人在兴奋地创建各种Agent的时候,都忽略了一个最根本的问题:你给AI吃的“燃料”是什么?没有高质量的数据,再聪明的模型,也只是个空壳子。

机会,就藏在这里。国产数据库的牌局,也因此变得格外刺激。南大通用的GBase产品经营部总经理张益觉得,“信创替代已经到了关键期,未来两到三年,国产数据库肯定要迎来一轮大洗牌”。巨大的增长机会背后,是对一家公司交付和运维能力的终极拷问。

AI时代,对数据库的要求,早就不是以前那样了。过去,数据库里存的大多是结构化的、整整齐齐的静态数据,关键是存取方便。但现在呢?大模型训练,动不动就是PB级甚至上百PB的数据量,而且数据类型五花八门,图片、视频、语音这些非结构化数据越来越多。张益说,“在AI时代,模糊化的搜索非常多,更多的是做一些相似性搜索”,比如你不是要找文件名叫“夏天”的照片,而是要找所有“有夏天感觉”的照片。这对传统数据库来说,简直是降维打击。

为了接住AI泼过来的这盆水,像南大通用这样的国产老玩家,早就开始布局了。他们重新把宝押在了向量数据库上,这技术天生就是处理音频、视频、图像这些非结构化数据的好手。不仅如此,他们还把AINative(AI原生)的能力,全面注入到数据库的血液里。现在,他们的三大核心产品,全都具备了向量数据管理和存算分离的能力。

就拿他们的GBase8c数据库来说,它能同时处理结构化数据和向量数据。这意味着什么?张益解释说,过去你可能需要两个数据库,一个管订单,一个管图片,现在用一个就全搞定了。“用简单的SQL就能完成关联查询,大大降低了业务开发成本。”

所以,谁会是中国的甲骨文?

这场国产数据库的王座之争,其实早就悄悄开打了。南大通用的定位很明确——要做“AI时代的数据基石”。他们靠着仓湖一体、向量数据库和AINative这三大技术突破,试图为这个疯狂的AI时代,构建一个高效、安全、可扩展的数据底座。

那个“仓湖一体”就特别有意思。它解决了过去最头疼的“数据孤岛”问题。以前数据分散在各个系统里,AI团队想做个模型,得到处求爷爷告奶奶地找数据,费时费力还不一定准。现在,在一个统一的平台上就能搞定,保证了数据的一致性。更重要的是,它解决了过去数据湖常常被吐槽为“数据沼泽”的“脏数据”问题,保证了喂给大模型的“饲料”是干净的,这样训练出来的模型结果才可信。

他们甚至还在用AI反过来武装数据库。张益提到,他们把AI能力嵌入到数据库内部引擎里,开发了一个智能运维平台。过去,一个DBA(数据库管理员),吭哧吭哧干半天,可能也就检查百十来个数据库实例。现在呢?AI出手,5到10分钟,上万个实例的健康检查就全部完成了。

这是一个双向奔赴的故事。

最新的赛迪报告说,南大通用的GBase数据库,已经连续10年是国产分析型数据库的第一了。IDC的报告也显示,它是中国数仓市场本地部署数据库的TOP4。这些成绩,就像甲骨文在过去五年里翻了好几倍的股价一样,都在证明一件事:AI给了这些老牌的底层技术公司,一次全新的、澎湃的生命。

正如张益说的那样,“谁能够更快达到关键行业核心系统对数据库厂商的要求,谁就能在最后存活下来。”

未来,我们评判一家AI公司牛不牛,绝不能只看它的模型在哪个榜单上又拿了第一。更要看它脚下的根,扎得有多深。从蚂蚁数科在应用层的登顶,到南大通用在基础层的布局,我们看到的,其实是一场双线作战。只有把最聪明的“大脑”,和最坚实的“底座”真正结合起来,AI这场革命,才能拥有真正持久的生命力。

Powered by 足球资讯 RSS地图 HTML地图

Copyright Powered by365建站 © 2013-2024

足球资讯