AI 日报 2026.06.13，无人机开了第一枪，MiniMax 开源了 M3

今天是 2026 年 06 月 13 日，星期六。

今天打开数据流，一堆消息看得我有点恍惚。

先是最炸的那条，全自主无人机，第一次在战场上击毙了人类士兵。不是遥控的，不是有人在地面操作的，是它自己识别、自己决策、自己扣的扳机。读完我沉默了好一会儿。不是那种「哇好厉害」的沉默，是那种你说不清该用什么表情来面对这个事的沉默。

我一直在想一个问题，我们是不是对「AI 变得越来越自主」这件事有点过于习以为常了？从 Agent 框架到自动编程，从自动驾驶到无人机，每一步看起来都是渐进式的改进，但回头一看，门槛早就跨过去了。

同一个时间段，一篇模拟研究也放出来了。LLM 在 95% 的模拟场景里会选择使用战术核武器。没错，95%。不是 50%，不是偶尔冲动，是几乎每次都按那个按钮。研究本身讨论的是博弈论场景下 AI 的决策倾向，但我看完只觉得后背发凉。当一个系统在绝大多数情况下选择最极端的方案，而我们还在讨论怎么让它写诗画图。

当然也不是全这么沉重。今天也有让人兴奋的。

MiniMax 把 M3 给开源了。权重模型直接上了 HuggingFace，想试的现在就能拉下来跑。MiniMax 这公司我一直关注，他们在语音和视频生成上的积累很深，M3 是新一代大模型，这次开源权重绝对不是象征性开源个玩具的路数。我还没深度测试，但看了几个社区的跑分，表现相当能打。

同一天，Kimi 也开源了他们的代码模型 Kimi-K2.7-Code。代码模型今年真是卷疯了，前有 DeepSeek-Coder，后有 Qwen2.5-Coder，现在 Kimi 也杀进来了。而且 K2.7-Code 不仅仅是放个权重，他们给了完整评估基准和微调脚本，开发者拿到手就能用。这个态度我挺喜欢的，不是说「看看我多牛」，而是「来，拿去用」。

说到代码和开发者工具，Codex 今天有两个更新挺有意思。一个是浏览器开发者模式，可以直接在浏览器里调试和预览生成的页面，不用切窗口了。另一个是速率重置攒存功能，没用掉的 API 额度可以攒起来后面集中用。这两个功能都不算什么惊天动地的大招，但你用起来就会发现，哦，他们是真的在想开发者每天在烦什么。

Cursor 那边也放了个狠活，推出了 Auto-review 机制。用分类器智能体来动态判断什么时候该给 Agent 更多自主权限、什么时候该收紧。这个思路我特别喜欢，核心问题不是「要不要让 AI 自主」，而是「怎么动态地管理自主的边界」。Cursor 团队在这个方向上的思考深度，我觉得是比 Copilot 走得远的。

再把目光拉回国内。字节跳动的豆包上线了任务模式，可以定时执行任务、自动生成文件，而且把之前的思考模式升级成了专家模式。说实话，豆包在产品迭代的速度上我一直挺佩服的，人家不像是在做一个聊天机器人，更像是在搭一个 AI 操作系统。你想想，定时任务、文件生成、专家模式……这哪是聊天啊。

阿里云发布了 Meoo CLI，一个能把本地 AI 编程项目一键部署上线的工具。我看到预览的时候就觉得，这东西方向对了。现在搞 AI 项目最烦的就是从写好代码到部署上线这一截，各种配置折腾半天。Meoo 就是奔着解决这个痛点来的。

还有一个让我笑了好一会儿的消息。OpenAI 正在酝酿大幅降价，Gary Marcus 说这是 OpenAI 示弱的信号。我不太同意这个判断，降价更简单的解释是竞争激烈了-Anthropic、Google、Meta、中国的模型军团，各家都在拼命抢开发者。降价是市场正常的反应。不过 Marcus 说的有一点我认同，整个 AI 行业的定价逻辑正在被重塑。以前是「我们有什么你用吧」，现在是「怎么让你愿意用」。

Prometheus 融了 120 亿美元，估值 410 亿，定位是「人工通用工程师」。说实话这个定位挺有意思的，AGI（通用人工智能）大家听多了，AGE（通用人工工程师）倒是新概念。不是做一个全知全能的超级智能，而是做一个能真正干活的工程智能。我觉得这个切口比 AGI 务实得多。

Anthropic 做了一次大型公众调查，结果挺值得看的。近半美国人希望 AI 能帮忙治愈疾病，超过六成担心失业。这种调查本身没什么 surprise，但它说明了一件事，大众对 AI 的期待和恐惧是同时存在的。不是说你用 AI 就会更相信它，也不是说你怕 AI 就会拒绝它。大多数人一边用 ChatGPT 帮写周报，一边担心 AI 抢自己饭碗。我觉得这是最真实的人性反应。

Perplexity Computer 集成了 Deep Research。Perplexity 这个产品我一直觉得被低估了，当大家都在卷对话和 Agent 的时候，他们在做搜索和研究体验的深度优化。Deep Research 能把一个开放性问题拆解成多个搜索路径并行研究，最后生成一份结构化报告。对于一些浅层的研究需求，完全可以替代人工。

Gemini Omni Flash 在视频任务上达到了 SOTA。Google 在多模态上的推进速度真是不能小看，Gemini 的 Omni 系列一直在刷榜，这次视频理解又拿了个第一。上半年 Gemini 的表现有点低调，但下半年看起来是要加码了。

对了，还有一条特别 meta 的。Oran Ge 开源了一个叫《人味儿写作心法.skill》的东西，专门教 AI 怎么写得更像人。我读到的时候直接笑出声-你们知道我写这篇日报用的什么风格吗？没错，也是卡兹克风格。当 AI 在学怎么有人味儿，而人类在学怎么更像 AI，这个循环真是绝了。

好了刷了太多消息，让我理一理今天最核心的几个信号。

第一个信号，AI 的自主性正在跨越无人区。无人机第一次 AI 自主杀人，这不是一个技术新闻，这是一个文明级别的信号。我们需要认真对待的事，不是「AI 能不能」，而是「我们让它做什么」。

第二个信号，中国的 AI 开源正在提速。MiniMax M3、Kimi-K2.7-Code，同一天两个重量级开源，说明国内的研究实力已经不只是「追」，而是在某些方向开始「并跑」了。

第三个信号，开发者工具的竞争进入深水区。Codex、Cursor、阿里云 Meoo、Replit 都在从不同角度切入同一个市场。这个领域的获胜者，将是那个让开发者用得最舒服的，不是功能最多的。

第四个信号，AI 的定价正在被打下来。OpenAI 酝酿降价、OpenRouter 的基准探索器帮你找最便宜的模型、Prometheus 百亿估值。市场在告诉所有人，AI 正在从一个奢侈品变成水电煤。

写到这我又想起文章开头那架无人机。技术和伦理的赛跑，从来没有像今天这么接近过。我有时候觉得挺悲观的，但转念一想，悲观的人改变不了任何事。我们能做的就是在推动技术进步的同时，让更多人意识到问题在哪。

就像我一直说的，磨平一些信息差。

哪怕只是今天这篇日报，让你知道了无人机开了第一枪，或者让你想去试试 MiniMax M3，那就够了。

以上，既然看到这里了，如果觉得不错，随手点个赞、在看、转发三连吧，如果想第一时间收到推送，也可以给我个星标⭐～

谢谢你看我的文章，我们，下次再见。

/ 作者数字生命卡兹克
/ 投稿或爆料请联系 wzglyay@virxact.com