范凯说 AI · 周日晚聊 第10期 - AI 时代的三场战争
主题:AI 时代的三场战争
日期:2026年3月8日
开场:三场战争,三个趋势
大家好,欢迎来到《范凯说 AI · 周日晚聊》,今天已经是第十期了,也意味着2026年已经过了十周。
本周有一条新闻让我思索了很久——美国和以色列联军对伊朗发动空袭,开战头24小时就打击了1000多个目标。这个数字本身不是最震撼的,震撼的是这1000多个目标是 AI 帮忙挑选出来的。从卫星数据分析、目标识别、法律审批到下令打击,整个流程都有 AI 的参与。AI 已经变成了军事行动最核心的决策机构。当 AI 从”帮你写文案”变成”帮你选轰炸目标”,我们进入了一个全新的阶段。
今天我们聊三条新闻,它们讲的其实是三场不同的”战争”:
第一,AI 打真实的战争——美军用 AI 精准打击伊朗,战争形态正在被重新定义;
第二,AI 公司之间的模型战争——GPT-5.4 发布,和 Claude 争夺”最佳 Agent 发动机”;
第三,AI 团队在大厂内部的组织战争——阿里通义千问核心团队出走,开源大模型的未来往哪走。
除此之外,后半段我想聊一个最近全中国都在疯狂的事情:小龙虾(OpenClaw)到底火在哪?热闹过后,什么才是真正的价值?
第一部分:本周 AI 新闻
新闻一:AI 打真实的战争——美军用 Claude + Palantir 精准打击伊朗
这是人类历史上第一场 AI 打的真实战争。
24小时轰炸了1000多个目标,这个打击系统背后有两家非常重要的公司。一家是 Palantir——名字取自《魔戒》中那个可以预知未来的水晶球,它是一家面向企业和国防领域的美国公司,创始人是德裔美国人 Alex Karp。另一家就是 Anthropic,提供 Claude 模型。
它的工作方式是这样的:Palantir 的 Maven Smart System 负责整个数据分析平台,聚合海量数据——卫星数据(马斯克的星链军用版”星盾”)、无人机监控、通信情报,包括以色列摩萨德的情报。所有数据汇聚之后,Claude 负责分析这些数据,识别目标、评估优先级、生成打击建议。最后人类指挥官审批,下令打击。
英国《卫报》的标题写得很好:**”AI-powered bombing quicker than speed of thought”——AI 驱动的轰炸,比人类的思考速度还快。** 军方管这个叫”缩短杀伤链”——从发现目标到打击落地,整个链条被 AI 大幅压缩。
几天之内,伊朗的空军、海军以及大部分导弹部队基本上都被瘫痪了。
当然,Anthropic 创始人达里奥·阿莫迪最近也闹了很大的情绪。他对美国国防部提出两点要求:第一,不能用 AI 监控美国国内的人;第二,用 AI 进行大规模杀伤时,必须经过人类指挥官审批,不能让 AI 自主指挥大规模杀伤性武器。这是未来必须考虑的 AI 安全与道德问题。
我的判断:
现代战争的形态已经发生了根本性变化。过去军事竞争比的是武器装备——三代机、四代机、五代机,导弹速度能不能突破反导系统。但现在竞争核心已经变成了 AI 驱动的精准打击能力和无人机集群战术。AI 在战争中的角色已经不是辅助工具,而是核心基础设施。没有 AI 加持的军队,在未来的战争中会处于根本性劣势。
新闻二:GPT-5.4 发布——Agent 发动机之争进入白热化
3月5号,OpenAI 发布了 GPT-5.4,自称”最强最高效的前沿专业模型”。发布了三个版本:标准版、Thinking 推理版和 Pro 专业版。
最值得讲的是:GPT-5.4 号称是第一个原生支持 Computer Use 的通用 AI 模型。 它的模型本身就可以调用工具链,赤裸裸地要成为最好的原生支持 Agent 的模型。在 OSWorld 基准测试上——衡量 AI 操作桌面电脑的能力——GPT-5.4 得分75%,超过了人类基准水平的72.4%。也就是说,AI 操作电脑执行白领工作的能力,事实上已经超过人类平均水平了。
为什么 Claude 的指令遵循特别好?
这里有一个有意思的技术细节。目前不管是 GPT 还是国产模型,大多是 MoE(混合专家)模型——模型参数量很大,但每次推理只激活其中一小部分,所以推理成本低、速度快。而 Claude 到目前为止还是一个 Dense(稠密)模型,不管什么任务都使用全部参数量。稠密模型推理更精准,但成本更高。这也解释了为什么 Claude 定价贵但用起来总觉得”人狠话不多”——指令遵循非常精准。
Agent 发动机之争的格局:
过去模型竞争比的是”谁更聪明”,看 Benchmark 分数。现在比的是”谁更能干活”——谁能成为 Agent 时代最好的发动机。目前领头羊就是两家:OpenAI 的 GPT 和 Anthropic 的 Claude。
这场竞争的本质是”谁来当 AI 操作系统”。如果过去 PC 时代是 Windows、Linux、macOS 争操作系统,现在 GPT 和 Claude 争的是 AI 时代应用的底层引擎。对我们普通用户来说这是好事——竞争会带来更强的工具和更低的成本。
关于国产模型的对比:
国产三大 Agent 基础模型——智谱 GLM、MiniMax 和 Kimi(月之暗面),各有特点。Kimi 和 Google 的 Gemini 类似,都支持100万上下文,适合科研和知识库调用。MiniMax 系统性地蒸馏了 Claude 模型(据曝光有1300万个问答对),所以它和 Claude 模型最为贴近。GLM 综合性比较好,有点像 GPT,但价格是三个中最贵的。不管怎么说,Agent 时代到来后,这三家的营收都在快速增长。
我的模型搭配方案:
主控模型:GPT Codex 5.3(编程、工具调用、逻辑推理强,且官方允许订阅套餐驱动小龙虾,量大管饱)
尖端任务:Claude Opus 4.6(指令遵循精准、废话少,但用量消耗极快)
量大管饱:智谱 GLM 4.7(大批量文档处理、网页抓取等不需要顶级智能的任务)
兜底:本地千问模型(Qwen3 Coder Next,80B 的 MoE 模型,每次激活3B,在 Mac Studio M4 上运行流畅)
建议大家至少搭配三个模型:一个主控、一个量大管饱的国产模型、一个用于尖端任务的 Claude。
新闻三:Qwen 核心团队出走——开源大模型的困境与阿里的战略迷失
3月4号凌晨,阿里通义千问(Qwen)大模型技术负责人林俊旸宣布辞职,随后多名核心成员跟着离开,包括后训练负责人。
这不是普通的人事变动。目前在全球开源大模型中,真正做到下载量和实际使用量第一的就是通义千问的 Qwen 模型。在全球最有影响力的中国 AI 大模型就两个——DeepSeek 和 Qwen。但 DeepSeek 是671B 的模型,太大了,用途相对有限,加上地缘政治原因很多海外场景不允许使用。所以真正在海外普及使用的开源模型,真正的全球开源模型扛把子,就是 Qwen。从某种意义上说,这是值得每个华人感到骄傲的事情。
但这样一个做到全球第一的开源模型,核心技术团队宣布离职了。
事情经过:
从后续发酵来看,这个技术团队是被通知的一方。阿里对 Qwen 团队做了组织调整——把原来垂直整合的预训练、后训练、Infra(基础设施)团队分拆开来,而且事先完全没有跟技术团队沟通。此外,阿里从 Google DeepMind 引进了一位华裔研究员来接手部分研发工作,林俊旸事先完全不知道。
这里还有一个有趣的细节:DeepMind 出来了一个人空降阿里,把千问核心团队逼走了;然后 DeepMind 在职的技术主管立刻在推特上发出召集令,欢迎 Qwen 核心技术团队加入 Google DeepMind。怎么看都像是 DeepMind 派了一个”特洛伊木马”来挖人——当然这只是一个经典的梗。
阿里 HR 戴珊事后的态度是”不能神化任何人”、”阿里集团不能被任何人挟持”——意思就是要走就走,集团不差任何一个人。
第一个维度:开源大模型的前景堪忧。
我们说的”大模型开源”,很多时候不是真正的开源。开源软件是你拿到源代码可以完全自己构建。但开源大模型开源的只是模型权重——你可以免费安装使用。预训练的数据集没有给你,后训练的 SFT 微调指令集没有给你,预训练代码和强化学习代码也都没有给你。你无法原原本本还原整个训练过程。用直播间观众的话说,就相当于”拿到了一个编译后的可执行文件”。
这意味着社区没有办法给模型提供有效反馈——不能反哺数据集,不能补代码。所以开源模型的意义和开源软件打了一个非常大的折扣,最终就是让大家白嫖、免费使用,商业模式很难建立。
从 Meta 的 Llama 到 Qwen,开源模型的发展道路上都遇到了瓶颈。与其说是”大模型开源”,不如说是”大模型免费”。免费和开源,是两件事。
第二个维度:阿里的 AI 战略出了问题。
阿里是一家云厂商,也是中国最大的云厂商,拥有全球顶级的开源模型。它最应该做两件事:第一,像微软、亚马逊、谷歌一样,用模型强化阿里云的 AI 服务能力;第二,用 AI 提升自己电商产品线的智能化。这才是阿里在 AI 时代正确的发力方向,本质上和亚马逊的战略应该高度重合。
但阿里在干什么?春节期间砸30亿搞外卖大战,在钉钉上做 AI 录音笔(抄袭海外产品 Plaud)。这些偏 C 端的产品,第一不符合阿里的基因——阿里在 PC 时代、移动互联网时代搞 To C 都没搞起来,根本没有 To C 基因;第二在 C 端流量上竞争不过字节和腾讯这种自带流量的公司。30亿砸下去,日活没砸上来,结果春节期间最火的是宇树的机器人和字节的豆包。
日活没完成,KPI 就要重新定,激励取消,该惩罚惩罚,资源该砍就砍——这是上层的商业逻辑。但这种逻辑简单粗暴,因为管理层没有真正理解 AI 产业发展的内在逻辑。战略上的错误,最终让核心技术团队来背锅。
阿里把员工当成机器上的零件,整个公司当机器来管理。在 AI 这种日新月异的创新时代,用管机器的方式管企业、管人才,最终一定会陷入僵化,创新走进死胡同。这也是中国公司出不来创新的一个非常严重的问题。
我的判断:
Qwen 过去的成功,不是因为”阿里”这三个字,而是因为核心技术团队的个人英雄主义带来的。核心人才比公司品牌更重要。一个顶尖的技术团队可以让一家公司的 AI 产品成为全球第一,团队一走,一切归零。
林俊旸的离开不仅仅是被分权的问题。他认可的方向已经走得很顺了,调整之后这个事肯定做不成。作为一个技术理想主义者,他不愿意看到自己辛辛苦苦的成果被彻底毁掉,所以选择离开——这是对自己技术成果的一种珍视。
我此前觉得中国互联网格局可能会是字节第一、阿里第二、腾讯第三。但这件事之后,我觉得阿里还是老老实实当第三吧。
第二部分:个人感想——小龙虾的真正价值在哪里
现象:全中国都在装”小龙虾”
OpenClaw 在 GitHub 上25万星标,超越所有开源项目,成为历史上增长最快的项目。腾讯云工程师在深圳南山腾讯大厦楼下摆摊免费帮人安装。到处都是收500块、1000块上门安装的服务。特别像2025年初 DeepSeek 刚出来的劲头。
但我想问一个问题:你装上了,然后呢?用它来干什么?
To C 的热闹往往只是一阵风
很多人装上小龙虾之后,干的第一件事就是让它整理文件、管日程、读邮件。这些事有用,但说实话,现在的 APP 已经做得很好了,你能省下来的可能每天就几分钟。
36氪有一篇文章标题说得很好:《第一批玩 OpenClaw 的人,已经开始清醒了》。里面提到一个很现实的问题:微信不让你抓数据,钉钉也不让。你想让 AI 读取聊天记录、生成日报——对不起,数据拿不到。To C 端的 AI 应用看起来很热闹,但真正落地时会撞上一堵又一堵的信息墙。
而且 To C 的热潮来得快去得也快。2025年上半年 DeepSeek 那么火,现在还有多少人在大量使用?
真正的价值在企业端——超级个体革命
小龙虾真正的价值在企业端,而且它解决的是一个非常深层次的问题:替代传统的企业软件开发模式。
过去一家企业想要一套符合自己业务流程的软件系统,有三种选择:
自己组团队开发——贵,周期长,大部分中小企业养不起专业软件团队。
外包给软件公司——质量参差不齐,沟通成本高,改需求就要加钱。
买标准 SaaS 产品——不贴合自己的业务,削足适履,双方都痛苦。
现在出现了第四种可能:1到3个 OPC(One Person Company,一人公司/超级个体),用小龙虾这样的 AI 工具,快速做出为行业客户定制的、符合其业务流程的个性化 AI 软件。 可能一两周就能快速交付。
关键在于什么?这些超级个体本身就是行业里的人。 比如你要解决金融行业客户的问题,你本身就是金融行业出来的行业专家。你有行业 know-how,懂业务流程,知道客户真正的痛点。你缺的不是行业理解,而是软件开发能力——而这恰恰是 AI 补上的那块短板。
这才是小龙虾最深层的价值:它不是让你多发几条消息、多管几个日程。它是让有行业经验的人,绕过传统软件开发的高成本和高门槛,直接把自己的行业 know-how 封装成小龙虾上的 Skill,变成一个可运行的行业垂直领域的 AI 软件产品。
我在2月11号录过一期关于这个话题的视频(当时还叫 CloudBot),发布时只有不到1万的播放量,最近几天飙到了55万。大家回过神来了——小龙虾应用在企业定制化软件方向,才是它真正发挥价值的地方。
与 Claude Code 的区别
有观众问这和直接用 Claude Code 有什么区别。Claude Code 交付的是一个软件产品,而用 OpenClaw 可以直接封装成 Skill,交付的是一个智能体。甚至可以和硬件结合——定制企业级的小龙虾打包成硬件盒子,在企业内部部署,内置好业务流程的 Skill,企业直接使用。过去可能要十几万甚至几十万才能解决的问题,现在几万块钱就能搞定。
OPC 产业生态正在形成
目前国内从政府端非常大力地鼓励 OPC 产业业态。以杭州为例,滨江区、上城区政府都在大力推 OPC 产业政策——给 OPC 更多的办公空间、公司税务减免、算力的巨额折扣和优惠。很多城市已经成立了人工智能局来鼓励 OPC。
现在的问题不在需求侧——企业有真实的软件需求,而且有降本的强烈要求,愿意花几万块钱先在边缘业务上试一试。问题在供给侧:真正有行业经验、同时又能把 AI 智能体玩转的优质 OPC,非常稀缺。那些营销能力强、又是行业专家、又会玩 AI 的 OPC,现在都非常赚钱。
传统企业软件市场每年几千亿。如果有几十万 OPC 能切入这个市场,其中会有很多人赚到钱。谁能用 AI 更好地服务企业客户,谁就能吃到这块蛋糕。小龙虾只是工具——关键不在工具,在于你。
给企业做 AI 落地的建议
新技术替代旧技术一定是从边缘开始突破。如果你是乙方给企业提供服务,一定要先从边缘业务做起——帮助一线员工解决小问题,部署小应用,几千块到一两万块钱,迅速帮他们解决头疼的问题。上来就搞核心业务,一定死得最快。反过来,如果你是企业内部的员工推动 AI,则应该往核心业务靠拢。
第三部分:观众互动
问:AI 创业周期有没有10年以上,能和98年以后的创业周期比吗?
至少3到5年没有任何问题。从移动互联网的经验来看差不多是10年周期。AI 因为改变更大,周期应该会更长。但我们不预测未来,只创造未来。
问:传统企业软件公司(泛微、金蝶、用友)未来怎么看?
他们唯一的优势就是长期积累的政府关系和客户关系。从技术和商业模式上,我觉得他们没有长期竞争力。OPC 都是从边缘创新开始突破的,时代还是往前发展的。
问:SaaS 从业者应该怎么做?
转型做 OPC。用你的行业经验和 AI 能力,直接服务客户。
问:本地向量化有什么实际效果?
最直接的效果就是记忆能力极强。所有跟你聊过的内容、你暴露给它的 Markdown 文档,它全部一清二楚。后续对话中它都知道。那种感觉就是”肚子里的蛔虫”——对你的了解已经到了比你自己还了解你的程度。我现在把碎片思维用苹果备忘录记录,通过 iCloud 同步到 Mac Studio,让小龙虾定期抓取并用 Obsidian CLI 串成知识网络,再加上向量检索,所有碎片思维都被整理成了网状知识。
问:企业私有化部署加小龙虾,模型能力是不是差很多?
不一定。要看你的应用需求。如果企业应用场景相对有限,Qwen 35B 或 70B/80B 的模型其实已经可以了。
问:多 Agent 之间怎么协作?
我自己目前还没有用到多 Agent 协作。单只龙虾分多个 Session 已经完全满足我的需要。复杂场景下可能会用到。
本期公告
个人网站上线
个人网站地址:fankaishuo.ai——用 Substack 搭建,国内可以直接访问。通过邮件订阅即可,绝大多数内容免费。后续所有文章、视频和平台入口都会汇聚到个人网站上。
社群迁移到 Telegram
Telegram 公开群:t.me/fankaishuoai(在 Telegram 搜索”fankaishuoai”即可找到)。
微信群太多了,有七八个,每个群只能500人,管理维护成本太高。Telegram 一个群上限20万人,可以分不同频道,管理高效。微信群不会解散,但会降低运营频率,主要精力放在 Telegram 社群。
如果不知道怎么加入,可以关注”范凯说AI”微信公众号,菜单选”社区”查看详细信息。
收尾
今天差不多就聊到这里。每周周日晚上9点,《范凯说 AI · 周日晚聊》,和大家分享本周 AI 行业新闻、个人思考,然后交流互动。我们下周同一时间再见。

