悉看大势:大国科技角力下一战 代理式AI谁是王者?

人工智能(AI)发展日新月异,竞争开发大语言模型的“百模大战”似乎才刚发生,但如今AI竞赛已开始迈向新阶段。业界将目光投向现实世界,开始探讨如何将最前沿的AI,运用在实际生活和生产中,通过代理式AI变现,帮助人们完成一些具体任务,如网购和订票。代理式AI目前处于什么阶段?接下来会面对什么挑战?对打工人带来什么影响?

今年农历新年,中国人工智能企业深度求索(DeepSeek)模型一夜间爆火,促使全球AI竞赛进入新阶段。至此,大国间的AI技术较量,已不再局限于模型和晶片,而是开始重新思索AI能如何造福于人,并争先布局应用方面。

科技领域的投资人发现,无论在中国还是美国,号称能代替人类作出决策并独立完成复杂任务的“代理式AI”(Agentic AI)和“AI智能体”(AI Agent,也称“AI代理”),正迅速吸引全球目光。

业界议论纷纷,这或成为全球AI竞赛的下一个关键战场。本周,中国再有新款AI产品问世,初创公司蝴蝶效应(Butterfly Effect)推出“代理式AI”产品Manus早期预览版,据称经基准测试性能超越OpenAI智能体DeepResearch。

新加坡智能交通企业AiGreenVision的首席执行官潘杰君接受《联合早报》访问时说:“AI的真正竞争,不在于哪个国家建立了最大的模型或最快的晶片,而在于谁能真的以改变行业的方式,来部署AI技术。”

顾问公司Beacon Thought Leadership联合创办人兼董事普尔迪(Mark Purdy)受访时指出,更长远来看,代理式AI或将从多个方面彻底重塑中美之间的技术经济竞争,因为它能带来的多领域生产力变革。

但也有投资人认为,虽然代理式AI,已成兵家必争之地,但可能尚未达到成熟阶段,某种程度上也是激烈竞争催促下的加速发展,未来能否成功商业化,还有待观察。

代理式AI具主动性决策能力

德勤研究称,AI智能体可在几乎没有人类干预的情况下,独立完成复杂任务并达成设定目标。但这类智能体,往往只能自行处理单一任务,并不具备自主性和多智能体协调能力。

而代理式AI,更像是一个系统或框架,可能包含一个或多个智能体,具有主动性和决策能力,能协调多个智能体,来完成比较复杂的任务。

新加坡Vibranium Consulting副总裁陈沛受访时说:“要完成复杂任务,往往需要通过多个代理的分工,才能做到。”

以谷歌推出的多AI智能体科研系统AI Co-Scientist为例,这个系统包括多个AI智能体,分别负责生成研究思路、规划分析、试验验证、反思改进等不同功能,再通过监督模型,进行统一编排。

陈沛指出,代理式AI并非新事物,它的发展离不开基础模型的进步。

例如,测试时间缩放(Test Time Scaling)方法的使用,明显提升了AI模型对复杂问题的推理能力,给开发代理式AI提供了规划分析、迭代反馈、验证执行结果等能力。

这个方法,就是在测试时调整时间范围或节奏,看AI模型还能不能正常发挥,适应新情况。这就须要在训练好的AI模型基础上,在推理阶段增加额外计算量,就像是让模型多“思考”一会儿,来提升输出的质量。

新加坡国立大学商学院教授、商业大数据分析中心联席主任庞严受访说,大语言模型赋能了代理式AI,而代理式AI就像是让模型学会“思考”,为大语言模型如何处理复杂任务提供框架,两者紧密相关。

许多耳熟能详的美国科技企业,正加紧布局这个“代理式AI”新赛道。

OpenAI今年推出名为“Operator”的AI智能体,称可完成一些网购和订票等具体任务。Anthropic和谷歌等企业,也相继发布AI智能体或是用于开发代理式AI的模型套件,并预言智能体可能终会成为公司“员工”之一。

亚马逊(Amazon)也不甘后人,2月26日宣布为迭代后的AI助理“Alexa”配备代理能力。SAP和ServiceNow等国际软件巨头,也相继投资研发AI智能体工具,并迅速推向市场。

波士顿咨询集团(BCG)预计,AI智能体市场规模到了2030年,将增至521亿美元(约700亿新元),是2024年57亿美元的九倍多。

在中国,DeepSeek的爆火,也让市场对AI运用有了更多想象力。从医疗健康、教育到法律领域,接入AI模型推出智能体产品的尝试,在中国正不断涌现。

但目前,中国市场的这些尝试多数还停留在单一智能体阶段,至于能实现多智能体协同工作的代理式架构,业内有声音认为,成熟产品还没出现。

DeepSeek横空出世 让代理式AI发展加速

不过,有投资业者认为,美国科技界对代理式AI高度关注,一定程度上是因为DeepSeek横空出世带来危机感。DeepSeek让美国科技界发现,中国的算法优化能力和AI技术创新能力已质变,华尔街科技股暴跌为此敲响警钟。

美国科技界意识到,不能只靠原先技术路径去发展大模型。于是,有望实现AI运用落地的智能体,便成了选择之一。

深耕科技投资的私募业者告诉《联合早报》,以OpenAI为例,智能体早已被写入公司的发展规划中,但在DeepSeek出现后,公司对代理式AI的探索有加速的迹象。

2024年7月,OpenAI内部发布了一个五步规划表,将AI发展分为五个阶段。智能体位处第三阶段。在发布这个规划时,OpenAI内部还坚信,他们只处在第一阶段。

潘杰君认为,中国和美国都已认识到,AI不仅是一种技术,而是助力经济和工业迅速增长的有效工具。

“我们现在正处于AI从被动智能,转向主动执行的阶段,通过现实运用证明价值。当企业看到这一点,其实不在乎哪个国家先开发了什么,更关心谁能带来成果。”

风投跑步入场 股市反响平淡

除了大型科技企业纷纷投资并推出代理式AI产品,如今,手持真金白银希望押中下一个OpenAI的资本也意识到,中美AI在硬件的竞争格局已明确,但运用的较量还存有足够想象空间。

风投资金跑步入场押注起步公司,并已开始推高相关企业的估值与人才溢价。

去年底,一家专注于开发AI智能体操作系统的美国起步公司/dev/agents,在种子轮融资中估值高达5亿美元。

CB Insights研究称,有37%的风投资金在2024年流向AI起步公司,创下新高。其中,投资活动增长最显著的是自主代理与“数字同事”(Autonomous agents & Digital co-workers),去年共20宗,同比增幅达150%。

花旗研究预计,代理式AI相关投资活动今年将继续增长,即便这个领域尚未出现“ChatGPT”般的突破性应用。

不过,股市似乎还没为代理式AI“买单”。例如,已推出智能体产品的ServiceNow,近期发布第四季业绩后,因来年业绩指引不及市场预期,股价暴跌。亚马逊2月26日宣布为Alexa更新代理能力后,股价没明显见长;微软和Alphabet的股价,目前也还没涨回DeepSeek出现前的水平。

代理式AI抢走“打工人”饭碗?

即便代理式AI在金融、市场营销,以及客户服务等领域都已有了应用案例,但仍处于早期阶段。企业在开发和部署环节仍面对诸多挑战,更别提在消费方面,还缺乏最契合的运用场景。 

陈沛说,头号挑战在于Agent框架开发部署的复杂性,虽然已有现成框架,但如何整合不同的基础模型,以及如何确保系统框架与模型独立、确保新模型发布时能无缝更新等,都是企业开发团队须权衡的。

此外,智能体的工作流程通常是“黑箱机制”,企业可能难以精确定位AI的决策过程是否出现错误并及时纠正。

其次是合规问题。陈沛认为,企业须设置安全护栏来控制智能体访问内部敏感数据的权限,避免在执行任务输出内容时遭致法律风险。

在消费方面,受访专家多认为,目前在面向消费者产品上部署代理式AI,仍缺乏更合适的应用场景,像OpenAI等企业推介的“点外卖”等功能,对用户而言并不算新奇。

Anthropic的研究人员指出,普通用户的需求比商业更为“个性化”,而当下AI智能体的能力,远未达到可以应付消费者使用习惯的水准。

还有潜在的成本问题,贝恩公司合伙人哈迪(Stephen Hardy)受访时说,使用代理式AI涉及多模型“交流”,可能会比用单一模型得出直接结论要来得昂贵。

据报道,OpenAI计划推出几款针对不同应用场景的智能体产品,其中面向“高收入知识工作者”的智能体可能收费高达每月2万美元。

难以忽视的监管难题

代理式AI也可能会给“打工人”带来不小的挑战。普尔迪相信,未来代理式AI将改变的是工作性质与就业市场:“有些任务会被自动化,有些人会因此被替代,也有的人将会转向与代理机器人共事。”

“但随着时间推移,人类与代理式AI一同工作的混合模式,可能将出现在许多职场中。”

潘杰君则指出,金融、物流和软件开发等行业的工作正在改写,AI正在接管部分任务、优化决策,并改变岗位的职责。

他说:“我认为未来五到10年将至关重要。能适应变化的公司将蓬勃发展,而抗拒变革的公司将面临困难。历史证明,每一次技术飞跃都会带来新机遇。关键不是害怕AI取代工作,而是意识到工作的本质正在改变。真正的赢家是那些学会与AI协作,而不是对抗它的人。”

代理式AI的高度自主和难以预测,可能也会给AI监管带来更多挑战。

普尔迪认为,基于任务性质、犯错后果、人类参与度等因素,以及代理式AI的工作特性,不同行业面临的相关监管问题可能会大相径庭。

“例如,代理式AI如在医疗领域出错,严重程度会远高于管理客户交付的代理式AI犯错。”普尔迪补充说。

潘杰君则指出:“监管机构仍在追赶,监管代理式AI的最大挑战不仅在于责任,还在于其不可预测性。当AI开始自行作出决策时,即使在设定的参数范围内,发生意想不到的后果的可能性也会上升。”

他补充,监管代理式AI需要灵活而坚定的治理框架,有明确的责任指导方针、透明度和适应性,法规需要和技术一样快速发展,而不是处在被动的落后位置。

但庞严认为,过于严格的监管可能也会限制技术的发展,最鲜明的例子就在于欧盟,正是因为强监管的压力,当地AI发展明显稍落后于中美。如何平衡监管和AI发展之间的天平,是值得监管机构研究的长久课题。

对AI领域投资者而言,相对宽松的监管,或许也能让他们在评估待投项目时有更多确定性,无须担心繁杂的 监管报备流程影响到项目的发展节奏。

您查看的内容可能不完整,部分内容和推荐被拦截!请对本站关闭广告拦截和阅读模式,或使用自带浏览器后恢复正常。