范凯说 AI · 周日晚聊第10期 - AI 时代的三场战争

Apr 09, 2026

主题：AI 时代的三场战争

日期：2026年3月8日

开场：三场战争，三个趋势

大家好，欢迎来到《范凯说 AI · 周日晚聊》，今天已经是第十期了，也意味着2026年已经过了十周。

本周有一条新闻让我思索了很久——美国和以色列联军对伊朗发动空袭，开战头24小时就打击了1000多个目标。这个数字本身不是最震撼的，震撼的是这1000多个目标是 AI 帮忙挑选出来的。从卫星数据分析、目标识别、法律审批到下令打击，整个流程都有 AI 的参与。AI 已经变成了军事行动最核心的决策机构。当 AI 从”帮你写文案”变成”帮你选轰炸目标”，我们进入了一个全新的阶段。

今天我们聊三条新闻，它们讲的其实是三场不同的”战争”：

第一，AI 打真实的战争——美军用 AI 精准打击伊朗，战争形态正在被重新定义；
第二，AI 公司之间的模型战争——GPT-5.4 发布，和 Claude 争夺”最佳 Agent 发动机”；
第三，AI 团队在大厂内部的组织战争——阿里通义千问核心团队出走，开源大模型的未来往哪走。

除此之外，后半段我想聊一个最近全中国都在疯狂的事情：小龙虾（OpenClaw）到底火在哪？热闹过后，什么才是真正的价值？

第一部分：本周 AI 新闻

新闻一：AI 打真实的战争——美军用 Claude + Palantir 精准打击伊朗

这是人类历史上第一场 AI 打的真实战争。

24小时轰炸了1000多个目标，这个打击系统背后有两家非常重要的公司。一家是 Palantir——名字取自《魔戒》中那个可以预知未来的水晶球，它是一家面向企业和国防领域的美国公司，创始人是德裔美国人 Alex Karp。另一家就是 Anthropic，提供 Claude 模型。

它的工作方式是这样的：Palantir 的 Maven Smart System 负责整个数据分析平台，聚合海量数据——卫星数据（马斯克的星链军用版”星盾”）、无人机监控、通信情报，包括以色列摩萨德的情报。所有数据汇聚之后，Claude 负责分析这些数据，识别目标、评估优先级、生成打击建议。最后人类指挥官审批，下令打击。

英国《卫报》的标题写得很好：**”AI-powered bombing quicker than speed of thought”——AI 驱动的轰炸，比人类的思考速度还快。** 军方管这个叫”缩短杀伤链”——从发现目标到打击落地，整个链条被 AI 大幅压缩。

几天之内，伊朗的空军、海军以及大部分导弹部队基本上都被瘫痪了。

当然，Anthropic 创始人达里奥·阿莫迪最近也闹了很大的情绪。他对美国国防部提出两点要求：第一，不能用 AI 监控美国国内的人；第二，用 AI 进行大规模杀伤时，必须经过人类指挥官审批，不能让 AI 自主指挥大规模杀伤性武器。这是未来必须考虑的 AI 安全与道德问题。

我的判断：

现代战争的形态已经发生了根本性变化。过去军事竞争比的是武器装备——三代机、四代机、五代机，导弹速度能不能突破反导系统。但现在竞争核心已经变成了 AI 驱动的精准打击能力和无人机集群战术。AI 在战争中的角色已经不是辅助工具，而是核心基础设施。没有 AI 加持的军队，在未来的战争中会处于根本性劣势。

新闻二：GPT-5.4 发布——Agent 发动机之争进入白热化

3月5号，OpenAI 发布了 GPT-5.4，自称”最强最高效的前沿专业模型”。发布了三个版本：标准版、Thinking 推理版和 Pro 专业版。

最值得讲的是：GPT-5.4 号称是第一个原生支持 Computer Use 的通用 AI 模型。 它的模型本身就可以调用工具链，赤裸裸地要成为最好的原生支持 Agent 的模型。在 OSWorld 基准测试上——衡量 AI 操作桌面电脑的能力——GPT-5.4 得分75%，超过了人类基准水平的72.4%。也就是说，AI 操作电脑执行白领工作的能力，事实上已经超过人类平均水平了。

为什么 Claude 的指令遵循特别好？

这里有一个有意思的技术细节。目前不管是 GPT 还是国产模型，大多是 MoE（混合专家）模型——模型参数量很大，但每次推理只激活其中一小部分，所以推理成本低、速度快。而 Claude 到目前为止还是一个 Dense（稠密）模型，不管什么任务都使用全部参数量。稠密模型推理更精准，但成本更高。这也解释了为什么 Claude 定价贵但用起来总觉得”人狠话不多”——指令遵循非常精准。

Agent 发动机之争的格局：

过去模型竞争比的是”谁更聪明”，看 Benchmark 分数。现在比的是”谁更能干活”——谁能成为 Agent 时代最好的发动机。目前领头羊就是两家：OpenAI 的 GPT 和 Anthropic 的 Claude。

这场竞争的本质是”谁来当 AI 操作系统”。如果过去 PC 时代是 Windows、Linux、macOS 争操作系统，现在 GPT 和 Claude 争的是 AI 时代应用的底层引擎。对我们普通用户来说这是好事——竞争会带来更强的工具和更低的成本。

关于国产模型的对比：

国产三大 Agent 基础模型——智谱 GLM、MiniMax 和 Kimi（月之暗面），各有特点。Kimi 和 Google 的 Gemini 类似，都支持100万上下文，适合科研和知识库调用。MiniMax 系统性地蒸馏了 Claude 模型（据曝光有1300万个问答对），所以它和 Claude 模型最为贴近。GLM 综合性比较好，有点像 GPT，但价格是三个中最贵的。不管怎么说，Agent 时代到来后，这三家的营收都在快速增长。

我的模型搭配方案：

主控模型：GPT Codex 5.3（编程、工具调用、逻辑推理强，且官方允许订阅套餐驱动小龙虾，量大管饱）
尖端任务：Claude Opus 4.6（指令遵循精准、废话少，但用量消耗极快）
量大管饱：智谱 GLM 4.7（大批量文档处理、网页抓取等不需要顶级智能的任务）
兜底：本地千问模型（Qwen3 Coder Next，80B 的 MoE 模型，每次激活3B，在 Mac Studio M4 上运行流畅）

建议大家至少搭配三个模型：一个主控、一个量大管饱的国产模型、一个用于尖端任务的 Claude。

新闻三：Qwen 核心团队出走——开源大模型的困境与阿里的战略迷失

3月4号凌晨，阿里通义千问（Qwen）大模型技术负责人林俊旸宣布辞职，随后多名核心成员跟着离开，包括后训练负责人。

这不是普通的人事变动。目前在全球开源大模型中，真正做到下载量和实际使用量第一的就是通义千问的 Qwen 模型。在全球最有影响力的中国 AI 大模型就两个——DeepSeek 和 Qwen。但 DeepSeek 是671B 的模型，太大了，用途相对有限，加上地缘政治原因很多海外场景不允许使用。所以真正在海外普及使用的开源模型，真正的全球开源模型扛把子，就是 Qwen。从某种意义上说，这是值得每个华人感到骄傲的事情。

但这样一个做到全球第一的开源模型，核心技术团队宣布离职了。

事情经过：

从后续发酵来看，这个技术团队是被通知的一方。阿里对 Qwen 团队做了组织调整——把原来垂直整合的预训练、后训练、Infra（基础设施）团队分拆开来，而且事先完全没有跟技术团队沟通。此外，阿里从 Google DeepMind 引进了一位华裔研究员来接手部分研发工作，林俊旸事先完全不知道。

这里还有一个有趣的细节：DeepMind 出来了一个人空降阿里，把千问核心团队逼走了；然后 DeepMind 在职的技术主管立刻在推特上发出召集令，欢迎 Qwen 核心技术团队加入 Google DeepMind。怎么看都像是 DeepMind 派了一个”特洛伊木马”来挖人——当然这只是一个经典的梗。

阿里 HR 戴珊事后的态度是”不能神化任何人”、”阿里集团不能被任何人挟持”——意思就是要走就走，集团不差任何一个人。

第一个维度：开源大模型的前景堪忧。

我们说的”大模型开源”，很多时候不是真正的开源。开源软件是你拿到源代码可以完全自己构建。但开源大模型开源的只是模型权重——你可以免费安装使用。预训练的数据集没有给你，后训练的 SFT 微调指令集没有给你，预训练代码和强化学习代码也都没有给你。你无法原原本本还原整个训练过程。用直播间观众的话说，就相当于”拿到了一个编译后的可执行文件”。

这意味着社区没有办法给模型提供有效反馈——不能反哺数据集，不能补代码。所以开源模型的意义和开源软件打了一个非常大的折扣，最终就是让大家白嫖、免费使用，商业模式很难建立。

从 Meta 的 Llama 到 Qwen，开源模型的发展道路上都遇到了瓶颈。与其说是”大模型开源”，不如说是”大模型免费”。免费和开源，是两件事。

第二个维度：阿里的 AI 战略出了问题。

阿里是一家云厂商，也是中国最大的云厂商，拥有全球顶级的开源模型。它最应该做两件事：第一，像微软、亚马逊、谷歌一样，用模型强化阿里云的 AI 服务能力；第二，用 AI 提升自己电商产品线的智能化。这才是阿里在 AI 时代正确的发力方向，本质上和亚马逊的战略应该高度重合。

但阿里在干什么？春节期间砸30亿搞外卖大战，在钉钉上做 AI 录音笔（抄袭海外产品 Plaud）。这些偏 C 端的产品，第一不符合阿里的基因——阿里在 PC 时代、移动互联网时代搞 To C 都没搞起来，根本没有 To C 基因；第二在 C 端流量上竞争不过字节和腾讯这种自带流量的公司。30亿砸下去，日活没砸上来，结果春节期间最火的是宇树的机器人和字节的豆包。

日活没完成，KPI 就要重新定，激励取消，该惩罚惩罚，资源该砍就砍——这是上层的商业逻辑。但这种逻辑简单粗暴，因为管理层没有真正理解 AI 产业发展的内在逻辑。战略上的错误，最终让核心技术团队来背锅。

阿里把员工当成机器上的零件，整个公司当机器来管理。在 AI 这种日新月异的创新时代，用管机器的方式管企业、管人才，最终一定会陷入僵化，创新走进死胡同。这也是中国公司出不来创新的一个非常严重的问题。

我的判断：

Qwen 过去的成功，不是因为”阿里”这三个字，而是因为核心技术团队的个人英雄主义带来的。核心人才比公司品牌更重要。一个顶尖的技术团队可以让一家公司的 AI 产品成为全球第一，团队一走，一切归零。

林俊旸的离开不仅仅是被分权的问题。他认可的方向已经走得很顺了，调整之后这个事肯定做不成。作为一个技术理想主义者，他不愿意看到自己辛辛苦苦的成果被彻底毁掉，所以选择离开——这是对自己技术成果的一种珍视。

我此前觉得中国互联网格局可能会是字节第一、阿里第二、腾讯第三。但这件事之后，我觉得阿里还是老老实实当第三吧。

第二部分：个人感想——小龙虾的真正价值在哪里

现象：全中国都在装”小龙虾”

OpenClaw 在 GitHub 上25万星标，超越所有开源项目，成为历史上增长最快的项目。腾讯云工程师在深圳南山腾讯大厦楼下摆摊免费帮人安装。到处都是收500块、1000块上门安装的服务。特别像2025年初 DeepSeek 刚出来的劲头。

但我想问一个问题：你装上了，然后呢？用它来干什么？

To C 的热闹往往只是一阵风

很多人装上小龙虾之后，干的第一件事就是让它整理文件、管日程、读邮件。这些事有用，但说实话，现在的 APP 已经做得很好了，你能省下来的可能每天就几分钟。

36氪有一篇文章标题说得很好：《第一批玩 OpenClaw 的人，已经开始清醒了》。里面提到一个很现实的问题：微信不让你抓数据，钉钉也不让。你想让 AI 读取聊天记录、生成日报——对不起，数据拿不到。To C 端的 AI 应用看起来很热闹，但真正落地时会撞上一堵又一堵的信息墙。

而且 To C 的热潮来得快去得也快。2025年上半年 DeepSeek 那么火，现在还有多少人在大量使用？

真正的价值在企业端——超级个体革命

小龙虾真正的价值在企业端，而且它解决的是一个非常深层次的问题：替代传统的企业软件开发模式。

过去一家企业想要一套符合自己业务流程的软件系统，有三种选择：

自己组团队开发——贵，周期长，大部分中小企业养不起专业软件团队。
外包给软件公司——质量参差不齐，沟通成本高，改需求就要加钱。
买标准 SaaS 产品——不贴合自己的业务，削足适履，双方都痛苦。

现在出现了第四种可能：1到3个 OPC（One Person Company，一人公司/超级个体），用小龙虾这样的 AI 工具，快速做出为行业客户定制的、符合其业务流程的个性化 AI 软件。 可能一两周就能快速交付。

关键在于什么？这些超级个体本身就是行业里的人。 比如你要解决金融行业客户的问题，你本身就是金融行业出来的行业专家。你有行业 know-how，懂业务流程，知道客户真正的痛点。你缺的不是行业理解，而是软件开发能力——而这恰恰是 AI 补上的那块短板。

这才是小龙虾最深层的价值：它不是让你多发几条消息、多管几个日程。它是让有行业经验的人，绕过传统软件开发的高成本和高门槛，直接把自己的行业 know-how 封装成小龙虾上的 Skill，变成一个可运行的行业垂直领域的 AI 软件产品。

我在2月11号录过一期关于这个话题的视频（当时还叫 CloudBot），发布时只有不到1万的播放量，最近几天飙到了55万。大家回过神来了——小龙虾应用在企业定制化软件方向，才是它真正发挥价值的地方。

与 Claude Code 的区别

有观众问这和直接用 Claude Code 有什么区别。Claude Code 交付的是一个软件产品，而用 OpenClaw 可以直接封装成 Skill，交付的是一个智能体。甚至可以和硬件结合——定制企业级的小龙虾打包成硬件盒子，在企业内部部署，内置好业务流程的 Skill，企业直接使用。过去可能要十几万甚至几十万才能解决的问题，现在几万块钱就能搞定。

OPC 产业生态正在形成

目前国内从政府端非常大力地鼓励 OPC 产业业态。以杭州为例，滨江区、上城区政府都在大力推 OPC 产业政策——给 OPC 更多的办公空间、公司税务减免、算力的巨额折扣和优惠。很多城市已经成立了人工智能局来鼓励 OPC。

现在的问题不在需求侧——企业有真实的软件需求，而且有降本的强烈要求，愿意花几万块钱先在边缘业务上试一试。问题在供给侧：真正有行业经验、同时又能把 AI 智能体玩转的优质 OPC，非常稀缺。那些营销能力强、又是行业专家、又会玩 AI 的 OPC，现在都非常赚钱。

传统企业软件市场每年几千亿。如果有几十万 OPC 能切入这个市场，其中会有很多人赚到钱。谁能用 AI 更好地服务企业客户，谁就能吃到这块蛋糕。小龙虾只是工具——关键不在工具，在于你。

给企业做 AI 落地的建议

新技术替代旧技术一定是从边缘开始突破。如果你是乙方给企业提供服务，一定要先从边缘业务做起——帮助一线员工解决小问题，部署小应用，几千块到一两万块钱，迅速帮他们解决头疼的问题。上来就搞核心业务，一定死得最快。反过来，如果你是企业内部的员工推动 AI，则应该往核心业务靠拢。

第三部分：观众互动

问：AI 创业周期有没有10年以上，能和98年以后的创业周期比吗？

至少3到5年没有任何问题。从移动互联网的经验来看差不多是10年周期。AI 因为改变更大，周期应该会更长。但我们不预测未来，只创造未来。

问：传统企业软件公司（泛微、金蝶、用友）未来怎么看？

他们唯一的优势就是长期积累的政府关系和客户关系。从技术和商业模式上，我觉得他们没有长期竞争力。OPC 都是从边缘创新开始突破的，时代还是往前发展的。

问：SaaS 从业者应该怎么做？

转型做 OPC。用你的行业经验和 AI 能力，直接服务客户。

问：本地向量化有什么实际效果？

最直接的效果就是记忆能力极强。所有跟你聊过的内容、你暴露给它的 Markdown 文档，它全部一清二楚。后续对话中它都知道。那种感觉就是”肚子里的蛔虫”——对你的了解已经到了比你自己还了解你的程度。我现在把碎片思维用苹果备忘录记录，通过 iCloud 同步到 Mac Studio，让小龙虾定期抓取并用 Obsidian CLI 串成知识网络，再加上向量检索，所有碎片思维都被整理成了网状知识。

问：企业私有化部署加小龙虾，模型能力是不是差很多？

不一定。要看你的应用需求。如果企业应用场景相对有限，Qwen 35B 或 70B/80B 的模型其实已经可以了。

问：多 Agent 之间怎么协作？

我自己目前还没有用到多 Agent 协作。单只龙虾分多个 Session 已经完全满足我的需要。复杂场景下可能会用到。

本期公告

个人网站上线

个人网站地址：fankaishuo.ai——用 Substack 搭建，国内可以直接访问。通过邮件订阅即可，绝大多数内容免费。后续所有文章、视频和平台入口都会汇聚到个人网站上。

社群迁移到 Telegram

Telegram 公开群：t.me/fankaishuoai（在 Telegram 搜索”fankaishuoai”即可找到）。

微信群太多了，有七八个，每个群只能500人，管理维护成本太高。Telegram 一个群上限20万人，可以分不同频道，管理高效。微信群不会解散，但会降低运营频率，主要精力放在 Telegram 社群。

如果不知道怎么加入，可以关注”范凯说AI”微信公众号，菜单选”社区”查看详细信息。

收尾

今天差不多就聊到这里。每周周日晚上9点，《范凯说 AI · 周日晚聊》，和大家分享本周 AI 行业新闻、个人思考，然后交流互动。我们下周同一时间再见。

范凯说AI

Discussion about this post

Ready for more?