本周,阿里在 AI 上动作频频。

3月16日,阿里突然官宣成立最新的 Alibaba Token Hub  事业群,由阿里巴巴CEO吴泳铭亲自挂帅。ATH 下设的通义实验室、MasS 业务线、千问事业部、悟空事业部以及 AI 创新事业部五子将形成合力,直指阿里的 AI 大战略。

但相比通义和千问这些大众熟知的部门(分别面向基础模型和C端入口),独立设部的悟空,对外人来说就显得有些许面生了。

不过就第二天,随着新版钉钉2.0发布,悟空也彻底走向了前台。

3月17日,新版钉钉与悟空全面整合,同时悟空也会有独立app,共同打造B端AI原生工作平台,将模型能力深度融入企业工作流。

淘宝、天猫、1688、支付宝、阿里云等阿里生态业务的 B 端商业能力,也会在后续以 skills 形式逐步嵌入该平台,作为阿里AI能力在企业工作场景的统一出口。

为什么阿里要在这个节点,做这样一次底层整合与架构调整?

之前钉钉搞得挺好,这次为啥又要单独设置悟空?钉钉和悟空的关系会变成什么?

从时间上来说,阿里选择在这个时间宣布也在情理之中。因为从某种意义上说,整个AI行业的商业思路最近一年来都在悄然变化。

几年来,国内外厂商在基础模型上的投入都是天价级别,但迟迟没有找到商业化收入的场景,靠用户充会员和调用API那三瓜俩枣很难抵得上成本。

但到了现在,基础模型的能力已经足以负责复杂工作流了,而企业对AI的需求也不仅仅是搞个数字人客服那么简单。所以很多头部厂商已经寻求企业合作,把模型真正嵌入企业工作流,来更接近商业化闭环。

今年 2 月,OpenAI 推出 Frontier,强调把 AI 接入企业跑跨部门流程;随后又拉上麦肯锡、BCG、Accenture、Capgemini 做 Frontier Alliances,帮助企业把 AI 从试点推到正式生产环境。

Anthropic 除了继续强化 Claude 在长时 agent 任务和工作流能力外,也开始上线面向 Team/Enterprise 的插件市场和管理员控制,并与 ServiceNow、Infosys 这类企业软件与服务商合作,把 Claude 直接嵌进高频业务流程里。

回到阿里身上,近段时间行业对阿里的感知,不乏有 AI 路线慢了的叙事。

不过从去年下半年开始,阿里内部本就已经开始多轮调整,更强调整合产品、模型、云计算等业务上原本的松散状态。

随着行业的商业化思路变迁,此时将 to B 方向的着力点放在企业级AI服务上,可以说正当其时:

眼下,头部玩家已经把商业化思路从卖基础模型,过渡到交付执行系统,也就是利用 AI+ 既有工作流来提供增量价值,先占住工作流和企业入口。

那么此时谁还停留在各业务线各自为战,谁就更容易错过 AI 商业化真正开始的窗口,这波泼天的富贵就只能眼睁睁看着别人端走。

既然要进企业工作流,阿里手里最锋利的刀,毫无疑问是钉钉。

此次发布会上,钉钉的定位也被进一步被拔高到了:阿里巴巴的企业级 AI 原生工作平台。

实际上,此前从新版 AI 钉钉1.0开始,这种利用钉钉重构企业AI使用方式的意图就初见端倪。除了早先提到的悟空OS,钉钉2.0木兰版本也将AI搜问嵌入了应用内部,提供更方便的AI能力。

但如果你以为这种尝试不会改变原有群聊交互逻辑,而只是外挂AI功能,那就有点小看阿里的决心了。

对阿里来说,钉钉最宝贵的价值,是成熟的商业场景。

举个例子,一个企业中谁能批十万块钱的款?谁能看核心财务报表?哪个部门的数据绝对不能跨境传输?哪个操作必须留底审计?

AI 如果想在公司里混,就必须了解这些职场规则。没有组织化、权限化的底座, AI 也只能是个写周报的边缘外包。

而靠着8亿用户、2700万家企业组织的基础,再经过十几年沉淀下来的企业内部管理秩序,钉钉从这些天然具备的商业场景中涌现的AI能力,就更能成为 AI 进入商业生产环境的完整答案。

这也是阿里的 AI to B 战略必须以钉钉为场景统一的原因。

除开钉钉本身的价值,发布会上钉钉这次更新的部分,也可以看出新版钉钉如何扛起企业级 AI 工作平台的大旗。

拿时下最火的各种龙虾来对比,在发布会上,无招对业界的龙虾产品质疑并不少。

相比之下,钉钉的易用性首先被做到极致,不需要复杂的本地安装部署,直接升级软件就可以开箱即用。在安全领域,企业级的权限管理和交付,采用容器级别的沙箱隔离,也比开源的本地龙虾更让人放心。

无招的总体看法是,第一悟空不止服务极客,聚焦普通用户真实需求;第二解决实际问题,而非炫技或追逐短期热度。

热产品做冷思考,慢即是快。

而要说到此次钉钉最硬核的动作,则是在底层架构上做了一次巨大调整。

我们甚至可以理解为,这是一次从 GUI 到 CLI 的革命。

所谓 GUI(图形用户界面),是在21世纪初期为了方便人类操作,所以将软件代码包装成按钮和菜单,依靠鼠标点击的交互形式。

以往我们让程序自动干活(比如传统的 RPA 机器人),逻辑也是以人类操作GUI的形式“照猫画虎”,靠程序模拟点击去操作。

但在AI时代,如果还是让让高智商的大模型先截图识别内容,找到按钮,再操控模拟鼠标去点击,这对AI来说是一种绕路,场景是错配的,只会带来巨大的算力浪费。

AI又不是人,为什么非得按照人类的操作习惯去用电脑呢?它完全可以用自己的交互方式去操控,这不比学人看屏幕再OCR识别省事得多?

于是这就让 GUI 诞生之前的 CLI(命令行界面)重新回到了C位。

钉钉这次之所以被称为 AI 原生工作平台,很重要的原因就是因为钉钉实现了全面 CLI ,把所有产品( IM、文档、日程、审批、会议、AI 表格等)重写成了 CLI指令,此时AI 就可以直接调用钉钉的一切能力和数据。

翻译成大白话就是:钉钉把自家房子的承重墙图纸和地下管网,全都向大模型敞开了。

按照钉钉的介绍,这么做相当于把一个服务7亿用户的产品从底层重写一遍,还要向 AI 交出系统的控制权。代价是巨大的,但带来的改变也很明显:AI 再也不用像个傻子一样去识别屏幕,而是可以直接在底层接口,以极高效率、最高级别权限去控制,调用命令。

这就好比以前你教它开车,要手把手教它怎么踩离合、转方向盘;现在 AI 完全焊死在了汽车底盘上,直接可以驱动四个轮子。

因此如果你在现在的钉钉里向悟空提问,悟空就会开始利用阿里内部的CLI,或者在本地电脑上帮你运行程序来实现。

举个例子,这里我让他安排五一期间成都旅游的机票酒店和路线攻略,悟空在后台操作完成后直接发在我的钉钉聊天框里。

那问题来了,既然钉钉这么牛,为啥在ATH事业群下不叫钉钉事业部,而是悟空事业部?

而且发布会上更意外的是,悟空并没有像之前一样塞在钉钉里,而是有独立的桌面端和 App。

这也许是阿里布局最精明的操作:如果悟空只是钉钉里的一个插件,那大家对它的认知永远被框死在钉钉助手里。

但阿里的野心,是让悟空成为整个企业级 AI 的跨系统调度中枢。

打个比方,如果钉钉是公司业务部门的写字楼,有门禁、有工位、有法务和财务。那么悟空的身份,就像拿着最高级别通行证的超级项目经理。它能在你们楼里穿梭,还能跑去隔壁老张家大厦、老李家大楼、甚至后台里去办事。

在发布会上,悟空同时发布了10个行业的 OPT (One Person Team) Skills 套件,也就是说任何一个人使用悟空,就可以获得钉钉的协同能力,以及整个阿里集团面向商家服务的商业能力。

比如电商行业里,以前做选品调研你得打开十几个网页查爆款,算门店数据、找供应、盯物流。这里我在悟空应用中新建对话,调用1688的能力来做选品分析和供应链调研,最后就可以生成完整的商业计划书。

同样,如果你是媒体从业者,也可以直接把需求发给它,让它调研所有平台爆火的话题,分析爆点,盘点内容逻辑,根据最近热门话题直接复刻。

类似的,如果需要生成视频动画,也只需要说一声,悟空自带的动画视频skill会帮你交付出行业级的视频素材。

说白了,悟空的本质是一个能随意调用整个阿里内部,乃至全网商业资源的“龙虾 + Manus”完全体,而不是帮你润色周报的普通 Agent,它很可能会成为一个改变企业办公形式的AI。

以前我们在电脑上办公,交互方式是人找软件,你需要去点开浏览器、打开 Excel、登录 CRM。但现在随着 MCP、Skill 、Manus 和龙虾这些技术应用出现,独立的悟空把这些全部揉在了一起。

很多过去需要一个部门、一个岗位、一套 SaaS 才能完成的事,以后可能会被压缩成一个人带着一个 AI 就能跑通的流程。

所以很可能早在钉钉提出 Agent OS 这个概念的时候,阿里就没打算只把悟空内嵌在钉钉里。

未来的企业办公场景恐怕不再是你在各种 APP 里疲于奔命、疯狂填表;而是你只需要给出意图,AI 在后台默默接管并完成了一切。

悟空独立出来,恰恰就是在抢占这个意图的新入口。作为一个能跨界整合资源的超级AI入口,它未来的生态甚至极有可能凌驾于现有钉钉之上。

这样来看,钉钉与悟空既合体又各自独立,也是阿里在探索一套全新的企业级AI使用方式,可以说非常面向未来。

自从无招回归之后,外界最直观的感受是钉钉开始往产品本身上收回注意力了。放弃堆功能,开始思考一个底层问题:在 AI 时代,企业到底该怎么工作?

而在行业内,阿里这种头部公司带来的改变,也会逐渐教其他企业学会如何在AI时代办公。AI时代,改变的不只是钉钉,还会有企业买软件的方式,员工使用软件的方式,甚至改变组织分工本身。

在这样的大变革下,悟空独立、钉钉重构、ATH 成立,可能都只是一个开头,至于下一代企业操作系统如何定义,AI商业化的新基建花落谁家,目前都还没有定论。

但阿里,显然已经首先迈出了一步。