这样的热度,在AI领域并不多见,毕竟Clawdbot既不是大厂发布的产品,也不是一次突破性的技术创新。
Clawdbot是一个开源的AI助手,用户只需通过日常使用的通讯软件发送消息,就能指挥它完成各种任务。下班想看电视剧?告诉Clawdbot,它会在你的电脑上打开相应页面,等你到家就能直接观看。这就是AI Agent,它让AI从能说会道进化到能办实事。
从2023年ChatGPT引爆生成式AI至今,大语言模型已经证明了自己能听懂人话的能力。现在,AI Agent能让对话变成行动。这种从理解对话到执行任务的跨越,正在重新定义AI的价值。
2026年,被视为AI Agent真正走向成熟和规模化应用的元年,这已经成为全球产业界的共识。德勤预测,Agentic AI领域正以年均43%的速度增长,远超其它AI赛道,标志着市场与技术已进入共振爆发期。
美国风投数据机构CB Insights的报告也显示,自2023年以来,上市公司财报电话会议中提及“Agent”的次数增加了10倍。AI Agent不再是技术团队的内部讨论议题,而是已经上升到CEO必须向投资者解释的战略重点。
硅谷巨头已不约而同all in Agent。OpenAI 正在推动 ChatGPT 与支付、日程、办公软件和第三方服务的深度结合。微软正在把Copilot 嵌入操作系统和企业工作流,谷歌则让Gemini 逐步进入搜索、邮箱和安卓系统。
在中国市场,AI Agent赛道呈现出更为激烈的竞争态势。2026年春节前后,三大互联网巨头几乎同时出招。
阿里将淘宝、支付宝、飞猪等APP都装进千问,实现“一句话办事”;字节与中兴合作推出豆包手机助手,直接把AI嵌入硬件。腾讯引入了Agent方向核心奠基人之一的姚顺雨,随后还启动了元宝派内测,打造社交型Agent。
AI Agent时代的“三国杀”格局正在形成。字节、阿里、腾讯都具备AI Agent成功的关键要素:资本投入、技术积累以及应用场景。更值得关注的是,三家各自的资源禀赋和战略考量不同,这将会决定它们在Agent竞赛中的不同打法。
从产业链视角看,AI Agent通常被分为上游的基础技术层、中游的平台层和下游的应用与服务层。
基础技术层包括LLM大模型和云计算基础设施提供商等,负责提供算力和模型能力;平台层包括Agent开发平台、工具链、API服务等,连接上下游;应用层则是面向用户的具体AI产品和服务,负责将技术转化为可感知的价值。
虽然三家都在布局全产业链,但阿里的战略重心和优势,明显倾斜于基础技术层和平台层,希望成为AI Agent时代的基建商。在上游和中游,阿里的优势明显。
1月26日,阿里正式发布通义千问旗舰推理模型Qwen3-Max-Thinking,总参数量超万亿,而且针对即将到来的Agent智能体时代,模型大幅增强了自主调用工具的原生Agent能力。与此同时,拥有To B 基因的阿里旗下有云服务平台,能为AI Agent提供从算力到部署的全栈支持。据称,阿里云百炼平台集成了200多款业界的大模型,能满足B端客户Agent开发所需的算力资源、大模型资源和应用工具链等需求。
当AI Agent淘金热到来时,阿里首先想成为提供铲子和水的那个人。但阿里也没有放弃应用层的商业价值。
1月15日,千问App宣布全面接入淘宝、支付宝、淘宝闪购、飞猪、高德等阿里生态业务,帮助用户实现点外卖、买东西、订机票等AI购物功能。这一动作,标志着阿里开始在应用层进攻。
这种阿里的打法,体现了集团生态资源的整合能力。从电商到支付,从出行到本地生活,阿里在过去九游娱乐文化 九游app官方入口二十年构建的商业生态,如今能成为AI Agent的工具箱。
然而,我们也要客观的认识到,阿里的场景虽然丰富,但打车、购物、旅游九游娱乐文化 九游app官方入口等都是中低频场景,用户不会每天都订机票、上淘宝,如果用户启动应用的频率不足,再出色的功能也难以被持续感知。因此,阿里当前的关键在于,如何围绕这些场景创造更日常化的价值点,有效提升用户的打开意愿和使用粘性。
更深层次的挑战在于,千问App接入淘宝、飞猪等业务,本质上是用AI替代传统的搜索+广告模式。当用户可以直接对AI说“帮我找条适合约会穿的连衣裙”并得到精准的AI推荐时,传统的搜索广告位价值会下降。
“做AI(人工智能)搜索很痛苦,里面暂时找不到地方放广告。”2024年底,周鸿祎就公开谈到了AI大模型的出现,给传统搜索平台带来的核心难题。AI推荐商业模式,也是眼下搜众多搜索广告平台的共同挑战。
阿里还面临着资源投入的压力。有消息称,阿里正考虑将未来三年在AI基建与云计算领域的投资,从原计划的3800亿元提升至4800亿元
做Agent时代的基础设施提供商需要长期、大量的资金投入,且回报周期相对较长;而C端突围同样需要巨额的流量采买、补贴激励和产品迭代投入。如何在基础层深耕和应用层突围之间平衡资源,也考验着阿里管理层的战略定力。
和阿里不同,字节选择all in 应用层,用流量优势抢占用户心智,同时通过软硬件布局试图掌控下一代交互入口。
PC时代主体是Web,移动时代是APP,AI时代则是Agent。火山引擎总裁谭待的这句判断,道出了字节对这场变革的理解。
如果Agent成为下一代的应用形态,那么谁能抢占入口,谁就能复制移动互联网时代的超级APP地位。字节对Agent的大力押注,让它在这场比赛上用百米冲刺的速度起跑,延续了其在移动互联网时代激进投入和快速迭代的做法。
有券商测算,字节跳动2024年在AI上的资本开支高达800亿元,2025年更是翻倍至1500亿-1600亿人元。尽管字节后来否定了2025年的数字,但从动作频率看,投入没有停下来的迹象。最近,字节火山引擎官宣成为2026年春晚的独家AI云合作伙伴,豆包也将配合上线多种互动玩法。这种“用钱砸出速度”的策略初见成效,豆包日活跃用户已突破1亿。
但流量获取只是第一步,字节真正的野心体现在打造一个超级入口。去年12月,字节与中兴合作推出豆包AI手机。这款手机搭载的豆包手机助手能代替用户操作手机,跨应用自动化执行任务,比如预订高铁票、购物比价。
1月19日,飞书与安克创新联合推出“AI录音豆”,豆包AI眼镜也预计在2026年第一季度发布无屏版。此外,从2023年底推出的AI Agent开发平台Coze(扣子)海外版,到2025年4月面向C端的“扣子空间”上线,字节也在平台层进行战略卡位。
然而,Agent赛道的竞争不仅是流量和速度的竞争,更是场景粘性、生态完整性和数据深度的综合较量。
首先,拥有流量不等于拥有粘性。第三方机构QuestMobile 数据显示,截至 2024 年底,以文本对话为核心的 AI 产品(如豆包、Kimi 等)用户日均使用时长普遍在 5 至 10 分钟,单次对线 次。豆包虽然DAU破亿,但用户的深度使用习惯是否已经形成还是未知数。
字节更大的隐忧在于深度场景的缺失。抖音、今日头条、红果短剧等字节系产品的核心是娱乐消费而非任务执行。大部分用户想要完成支付、购物、社交等深度任务时,第一反应仍然是打开微信、支付宝、淘宝。
这种隐忧在豆包手机助手的尝试中暴露出来。豆包手机助手推出后,很快遭遇微信、支付宝、淘宝等头部App的风控拦截。
豆包手机助手采用的是GUI读屏技术,即通过视觉识别理解屏幕内容,模拟用户点击来操作第三方应用,这引发了数据安全和用户隐私的争议。随后,豆包团队主动暂停了AI在金融、支付、游戏等高敏场景的操作能力。
当豆包试图跨平台调用这些能力时,不仅会遭遇风控的问题,长远来看,更是商业利益的根本冲突。
腾讯:基于生态和场景的长线年底,当定义了Agent范式的核心人物姚顺雨加入腾讯,腾讯在AI上的打法和布局才逐渐被外界看清:同时押注基础技术层和应用层。
姚顺雨提出了ReAct和 Tree of Thoughts (思维树) ,让AI学会“边想边做”,是当前所有Agentic AI的技术源头。
更关键的是,用户不会关心模型有多少参数,而是关心AI能不能真的把事情做完。
“提高AI回答质量,需要的不是更强的模型或搜索引擎,而是更多的额外输入。”姚顺雨在年初中关村的“基模四杰”聚会上直言不讳。这个“额外输入”就是上下文(Context),可以简单理解为AI在处理当前任务时能够同时参考的信息总量。
从技术演进看,上下文窗口的扩展一直是大模型能力提升的核心方向之一。从Anthropic 推出 200k 上下文窗口的 Claude 3,到 Google 通过 Gemini 3 Pro 将这一数字推向百万级 Token,硅谷巨头一直在加码上下文能力。窗口越大,模型一次能“记住”的内容就越多,推理往往就越连贯、越稳定。但这更多体现的是技术层面的上下文扩展,更关键的还有数据层面的上下文,即上下文的质量。
此外,日活用户超过6亿的微信小程序拥有最自然、最完整的Agent生态。这意味着出行、购物、阅读、办公、政务等几乎所有频次的场景都在微信生态内有触点。如果用户需要在微信里调用AI小程序执行任务,不需要重新登录账号,也不需要跳转到其他App,整个流程是原生的、闭环的。
加上微信一贯克制的产品哲学,微信在AI化进程上不会太激进。这种克制是一把双刃剑。一方面,过度克制可能会错过窗口期。但从长期来看,如果腾讯能在隐私保护和产品AI化之间找到平衡,这可能会比着急推出一个“半成品”更有价值。
马化腾在刚刚结束的腾讯2025年的员工大会上表态,AI全家桶未必是大家都喜欢的,未来将继续坚持去中心化,以兼顾用户需求和隐私安全的方式来思考规划微信的智能生态,让大家都能放心使用。看起来,腾讯在AI战略上还是会保持自己的节奏。