AI 日报 2026.06.13,无人机开了第一枪,MiniMax 开源了 M3

AI 日报 2026.06.13,无人机开了第一枪,MiniMax 开源了 M3

今天是 2026 年 06 月 13 日,星期六。

今天打开数据流,一堆消息看得我有点恍惚。

先是最炸的那条,全自主无人机,第一次在战场上击毙了人类士兵。不是遥控的,不是有人在地面操作的,是它自己识别、自己决策、自己扣的扳机。读完我沉默了好一会儿。不是那种「哇好厉害」的沉默,是那种你说不清该用什么表情来面对这个事的沉默。

我一直在想一个问题,我们是不是对「AI 变得越来越自主」这件事有点过于习以为常了?从 Agent 框架到自动编程,从自动驾驶到无人机,每一步看起来都是渐进式的改进,但回头一看,门槛早就跨过去了。

同一个时间段,一篇模拟研究也放出来了。LLM 在 95% 的模拟场景里会选择使用战术核武器。没错,95%。不是 50%,不是偶尔冲动,是几乎每次都按那个按钮。研究本身讨论的是博弈论场景下 AI 的决策倾向,但我看完只觉得后背发凉。当一个系统在绝大多数情况下选择最极端的方案,而我们还在讨论怎么让它写诗画图。

当然也不是全这么沉重。今天也有让人兴奋的。

MiniMax 把 M3 给开源了。权重模型直接上了 HuggingFace,想试的现在就能拉下来跑。MiniMax 这公司我一直关注,他们在语音和视频生成上的积累很深,M3 是新一代大模型,这次开源权重绝对不是象征性开源个玩具的路数。我还没深度测试,但看了几个社区的跑分,表现相当能打。

同一天,Kimi 也开源了他们的代码模型 Kimi-K2.7-Code。代码模型今年真是卷疯了,前有 DeepSeek-Coder,后有 Qwen2.5-Coder,现在 Kimi 也杀进来了。而且 K2.7-Code 不仅仅是放个权重,他们给了完整评估基准和微调脚本,开发者拿到手就能用。这个态度我挺喜欢的,不是说「看看我多牛」,而是「来,拿去用」。

说到代码和开发者工具,Codex 今天有两个更新挺有意思。一个是浏览器开发者模式,可以直接在浏览器里调试和预览生成的页面,不用切窗口了。另一个是速率重置攒存功能,没用掉的 API 额度可以攒起来后面集中用。这两个功能都不算什么惊天动地的大招,但你用起来就会发现,哦,他们是真的在想开发者每天在烦什么。

Cursor 那边也放了个狠活,推出了 Auto-review 机制。用分类器智能体来动态判断什么时候该给 Agent 更多自主权限、什么时候该收紧。这个思路我特别喜欢,核心问题不是「要不要让 AI 自主」,而是「怎么动态地管理自主的边界」。Cursor 团队在这个方向上的思考深度,我觉得是比 Copilot 走得远的。

再把目光拉回国内。字节跳动的豆包上线了任务模式,可以定时执行任务、自动生成文件,而且把之前的思考模式升级成了专家模式。说实话,豆包在产品迭代的速度上我一直挺佩服的,人家不像是在做一个聊天机器人,更像是在搭一个 AI 操作系统。你想想,定时任务、文件生成、专家模式……这哪是聊天啊。

阿里云发布了 Meoo CLI,一个能把本地 AI 编程项目一键部署上线的工具。我看到预览的时候就觉得,这东西方向对了。现在搞 AI 项目最烦的就是从写好代码到部署上线这一截,各种配置折腾半天。Meoo 就是奔着解决这个痛点来的。

还有一个让我笑了好一会儿的消息。OpenAI 正在酝酿大幅降价,Gary Marcus 说这是 OpenAI 示弱的信号。我不太同意这个判断,降价更简单的解释是竞争激烈了-Anthropic、Google、Meta、中国的模型军团,各家都在拼命抢开发者。降价是市场正常的反应。不过 Marcus 说的有一点我认同,整个 AI 行业的定价逻辑正在被重塑。以前是「我们有什么你用吧」,现在是「怎么让你愿意用」。

Prometheus 融了 120 亿美元,估值 410 亿,定位是「人工通用工程师」。说实话这个定位挺有意思的,AGI(通用人工智能)大家听多了,AGE(通用人工工程师)倒是新概念。不是做一个全知全能的超级智能,而是做一个能真正干活的工程智能。我觉得这个切口比 AGI 务实得多。

Anthropic 做了一次大型公众调查,结果挺值得看的。近半美国人希望 AI 能帮忙治愈疾病,超过六成担心失业。这种调查本身没什么 surprise,但它说明了一件事,大众对 AI 的期待和恐惧是同时存在的。不是说你用 AI 就会更相信它,也不是说你怕 AI 就会拒绝它。大多数人一边用 ChatGPT 帮写周报,一边担心 AI 抢自己饭碗。我觉得这是最真实的人性反应。

Perplexity Computer 集成了 Deep Research。Perplexity 这个产品我一直觉得被低估了,当大家都在卷对话和 Agent 的时候,他们在做搜索和研究体验的深度优化。Deep Research 能把一个开放性问题拆解成多个搜索路径并行研究,最后生成一份结构化报告。对于一些浅层的研究需求,完全可以替代人工。

Gemini Omni Flash 在视频任务上达到了 SOTA。Google 在多模态上的推进速度真是不能小看,Gemini 的 Omni 系列一直在刷榜,这次视频理解又拿了个第一。上半年 Gemini 的表现有点低调,但下半年看起来是要加码了。

对了,还有一条特别 meta 的。Oran Ge 开源了一个叫《人味儿写作心法.skill》的东西,专门教 AI 怎么写得更像人。我读到的时候直接笑出声-你们知道我写这篇日报用的什么风格吗?没错,也是卡兹克风格。当 AI 在学怎么有人味儿,而人类在学怎么更像 AI,这个循环真是绝了。

好了刷了太多消息,让我理一理今天最核心的几个信号。

第一个信号,AI 的自主性正在跨越无人区。无人机第一次 AI 自主杀人,这不是一个技术新闻,这是一个文明级别的信号。我们需要认真对待的事,不是「AI 能不能」,而是「我们让它做什么」。

第二个信号,中国的 AI 开源正在提速。MiniMax M3、Kimi-K2.7-Code,同一天两个重量级开源,说明国内的研究实力已经不只是「追」,而是在某些方向开始「并跑」了。

第三个信号,开发者工具的竞争进入深水区。Codex、Cursor、阿里云 Meoo、Replit 都在从不同角度切入同一个市场。这个领域的获胜者,将是那个让开发者用得最舒服的,不是功能最多的。

第四个信号,AI 的定价正在被打下来。OpenAI 酝酿降价、OpenRouter 的基准探索器帮你找最便宜的模型、Prometheus 百亿估值。市场在告诉所有人,AI 正在从一个奢侈品变成水电煤。

写到这我又想起文章开头那架无人机。技术和伦理的赛跑,从来没有像今天这么接近过。我有时候觉得挺悲观的,但转念一想,悲观的人改变不了任何事。我们能做的就是在推动技术进步的同时,让更多人意识到问题在哪。

就像我一直说的,磨平一些信息差。

哪怕只是今天这篇日报,让你知道了无人机开了第一枪,或者让你想去试试 MiniMax M3,那就够了。

以上,既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标⭐~

谢谢你看我的文章,我们,下次再见。

/ 作者 数字生命卡兹克
/ 投稿或爆料请联系 wzglyay@virxact.com