AI 日报 2026.06.12:自主武器、千亿融资与 AI 价格战

故事是这样的。

今天凌晨,我在刷 Hacker News 的时候,看到了一条让我愣了好几秒的消息。全自主无人机,第一次在实战中击毙了人类士兵。不是遥控的。是它自己决定的。

我盯着屏幕看了半天。

然后顺着往下刷,又看到另一篇研究模拟,给 LLM 模拟环境,95% 的情况下它会选择使用战术核武器。

得,今天的日报注定不会太轻松。

全自主无人机,第一次开了火

《新科学家》6月10号发了篇报道,说历史上第一次,一架全自主运行的无人机在实战中执行了致命攻击。没有人类操作员在回路中,就是无人机自己识别、自己判断、自己开了火。

我之前一直觉得这种新闻还在「讨论中」的阶段,伦理委员会扯皮、专家写专栏、各国表态,突然它就真的发生了。细节现在还不多,新科学家的那篇文章我贴一下感兴趣可以去看,Fully autonomous drones have killed human soldiers for the first time

与此同时,另一组模拟实验也在今天引起了不小的讨论。Kenneth Payne 搞了个研究,把 LLM 放进模拟环境里,结果是,95% 的模拟场景下,LLM 会选择使用战术核武器。你说这是 LLM 太激进还是模拟设置的问题?我觉得更值得问的是,我们已经开始认真思考这些问题了吗。

Prometheus,120亿美金,7个月,0产品

聊个轻松一点的。不不不,这也轻松不到哪去。

Jeff Bezos 的 AI 公司 Prometheus,成立才 7 个月,目前还没交付任何产品,以 410 亿美元的估值融了 120 亿美元。没错,你没有看错,410亿估值,零产品交付。最初估值才 62 亿,短短几个月翻了快 7 倍。

他们的口号叫「人工通用工程师」,说要把设计到制造的循环压缩 10 倍以上。听起来很唬人对吧?但问题是,物理经济不像互联网数据那样可以随便爬取,制造业的训练数据根本没有那么多。

所以 Prometheus 做了一件事,自己买工厂。他们拆了几家制造企业,自己当数据的生产者。这个思路怎么说呢……非常 Bezos。既然没有数据,那就自己造一条数据流水线。一条数据流水线。

OpenAI 这两天动作很大

先说收购。OpenAI 宣布要收购 Ona,之前你可能没听过这个名字。Ona 是做啥的?是一个提供安全、持久云端运行环境的平台。我理解就是给 Codex 配了一个「宿舍」,让它可以在云端长时间跑、持续工作,不用担心掉线或者上下文丢失。

什么意思呢?你睡前给 Codex 一个任务,它在云端跑一夜,第二天醒来验收。听起来是不是很耳熟?像不像我们之前聊过的自主智能体的那套玩法。OpenAI 正在把 Codex 从一个「你写代码时帮你补全」的工具,变成「你睡觉时它在写代码」的自主生产力。

另外,OpenAI 还跟 Oracle 云合作了,你可以用现有的 Oracle 云承诺额度直接访问 OpenAI 的模型和 Codex。对已经绑定 Oracle 的企业来说这很棒,不再需要单独申请预算买 OpenAI 的额度。同时 OpenAI 也在支持欧盟的 AI 内容透明度行为准则,大公司在合规这块还是在往前走的。

还有一条值得关注,知名 AI 批评者 Gary Marcus 发了篇文章说 OpenAI 正在酝酿「大幅」降价,他认为这是示弱信号,说明 OpenAI 面对竞争有点吃力了。我自己的感受是,价格战在模型层确实越来越激烈,但对企业用户来说这未必是坏事。

Anthropic,企业级渗透 + 公益奖学金,两手抓

Anthropic 今天搞了两件大事。

第一个,跟 DXC Technology 达成全球联盟。DXC 是干啥的?一家大型 IT 服务公司,给全球的大型银行、航空公司、保险公司和政府机构运营关键系统。DXC 要培训数万名获得 Claude 认证的「前沿部署工程师」,把 Claude 引入这些传统行业的核心系统。

Claude 已经是 DXC 内部 OASIS 平台的默认模型了,有超过 10 万人正在用。

第二个事,Anthropic 启动了 Claude Corps 奖学金项目。面向早期职业生涯的年轻人,培训 1000 名研究员用 Claude,然后匹配到美国非营利组织全职工作一年。年薪 85000 美元加福利,每周还有 5 小时持续培训。Anthropic 初始投入了 1.5 亿美元。说实话,看到这种新闻我还是挺触动的。当一个 AI 公司能做到这个体量时,用一部分资源去培养下一代人,这是让我觉得「方向对了」的事。

另外,Anthropic 的 CEO Dario Amodei 今天也专门发文呼吁缩小 AI 政策差距,同时警告 AI 可能会造成大规模、长期性的岗位流失。他的观点很直白,AI 系统就是用来复刻人类认知的,所以失业是结构性必然,不是「可能会发生」而是「一定会发生」。他提了几个应对方向,完善劳动力市场监测、薪资保障、培训补贴,如果人力需求永久下降就搞全民基本收入。

模型与产品更新,Midjourney V8.1、Gemini Omni、Cursor Auto-review、Grok 插件市场

Midjourney V8.1 成默认模型。默认模型从 V7 升到了 V8.1,智能性、连贯性、对详细提示的遵循度以及文本渲染效果都有提升,HD 模式也支持了。如果你还在用默认的 V7 没感觉,换个 V8.1 试试,差距还挺明显的。

Gemini Omni Flash 在视频任务上达到了 SOTA。Logan Kilpatrick 发推说在图像到视频、文本到视频和视频编辑方面都达到 SOTA,很快会通过 API 提供。多模态这块,Google 确实一直在往前推。

Cursor 推出了 Auto-review 机制。这是一个我很感兴趣的更新。简单说,Cursor 现在有一个专门的分类器智能体,在每个工具调用之前先审查动作风险。分类器判断动作是否跟你的意图一致,高风险就阻止并返回解释,低风险就放行。有意思的是他们用了小模型,跑在智能体循环内以避免额外延迟,还能读取工作区文件来辅助判断。做了大概 12 小时的内部开发测试后上线。

这个思路特别好。不是限制智能体的能力,而是加一道「安全门」让智能体自己检查自己。我觉得这是 AI 编程助手进化的重要方向。

xAI 推出 Grok Build Plugin Marketplace。Grok Build 内置了一个插件市场,把技能、斜杠命令、AI 智能体、钩子、MCP 服务器和 LSP 都打包成可安装包,你不需要离开终端就能浏览、安装和更新。首发合作伙伴包括 MongoDB、Vercel、Sentry、Chrome DevTools、Cloudflare 和 Supabase。可以想象一下,以后写代码时这些全都整合到终端里一键安装。嗯,xAI 的速度是真的快。

编程工具百花齐放,Replit、Perplexity、阿里云、腾讯混元

Replit 今天发了两条重要更新。Agent 新增了自定义指令与技能功能,你可以告诉它你的项目组织方式、品牌指南,它会自动在每次生成时记住这些偏好。另外 Replit 跟 Databricks 的集成也升级了,公开预览已经开放。

Perplexity Computer 集成了 Deep Research。现在 Deep Research 作为原生技能连到了 Computer 的智能体框架里,可以访问搜索即代码生成、长运行沙箱、连接器、工具和授权数据。Pro 和 Max 订阅者现在就能用。

阿里云发布了 Meoo CLI(「秒悟」)。面向开发者,支持 Claude Code、Codex、Cursor 等本地 AI 编程助手,通过阿里云的云端能力自动完成数据库接入、用户登录、文件存储和项目发布,一句话把本地项目部署上线。我觉得这个定位挺好的。本地 AI 编程越来越强,但很多人的卡点是「写完了怎么上线」。

腾讯混元开源升级了 HPC-Ops 推理算子库,五大核心算子,长文本最高加速 2.95 倍,端到端 QPM 提升 17%。国内大厂在底层 Infra 上的投入越来越深,这是好事。

一些值得关注的小事

OpenRouter 推出了基准探索器,为 10 个不同基准绘制了帕累托曲线。你可能觉得这个不性感,但如果你要选模型的话,这玩意比看 benchmark 排名靠谱一万倍。

Krea 2 推出了生成式滑块,可以控制生成图像的强度、复杂度和运动。图像生成越来越向「可控制」的方向走了,这比我之前设想的还快。

Claude Fable 5 一句话生成了一个 3D 台球游戏。提示词就一行,「设计一个完整的能玩的3D桌球游戏,一个网页就能运行」。然后真的一行搞定了。你说这夸张吗?但它就是真的。

Hermes Agent Desktop 发布了,硅基流动支持一键切换模型。DeepSeek-V4、GLM-5.1、Kimi-K2.6、MiniMax-M3,在硅基流动上都能跑。开源社区这边一直很热闹。

Deezer 推出 AI 音乐检测器,可以扫描其他流媒体平台的播放列表来检测 AI 生成音乐。Deezer 是最早标记 AI 音乐的平台之一,因为其他平台没跟进,他们就干脆开放给用户自己用了。

最后,卡兹克自己也写了一篇 WorkBuddy 的教程。国内通用 Agent 产品的从 0 到 1 速通指南,有兴趣的同学可以去看看。

一点感想

今天这一期日报,我自己写的时候情绪一直在摆荡。从无人机自主杀人到核武器模拟,这些话题真的不轻松。但同时,Claude Corps 这样的项目又让我觉得还是有希望的。

AI 的发展速度已经快到了连政策都跟不上的程度。Amodei 说「极快」我觉得还是保守了。你想想,去年这个时候我们还在争论 GPT-4 能不能做点正经的 coding,今天全自主无人机已经在战场上了。

每个时代都有它让人不安的一面。但我觉得,保持关注、保持讨论、保持「这不对」的判断力,比假装岁月静好更有用。

反正我觉得,磨平一些信息差,总比在信息茧房里被算法喂养要好。

以上,既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标⭐~

谢谢你看我的文章,我们,下次再见。

> / 作者 卡兹克
> / 联系邮箱 wzglyay@virxact.com