AI 日报 2026.05.19:Claude 5 击穿 M5 内核防线、OpenAI 史上最大重组

AI 日报 2026.05.19:Claude 5 击穿 M5 内核防线、OpenAI 史上最大重组

\n

\n\n AI 日报封面图\n\n \n

今天的 AI 圈发生了两件足以载入史册的事。

\n\n

一是 Anthropic 的 Claude 5 用 5 天时间做了一件苹果花 5 年、砸了数十亿美元都没做成的事——从普通用户权限攻破 M5 芯片的内存完整性防护,拿到 root。这不是一个零日漏洞,而是一个完整的内核利用链,由 AI 自主构建和演示。

\n\n

二是 OpenAI 宣布了史上最大规模重组——ChatGPT、Codex、API 三大核心产品线合并为统一组织,Brockman 全面掌权,竞争对手 Anthropic 估值飙升至 9000 亿美元。一边是防线被 AI 击穿,另一边是 AI 公司本身在经历最剧烈的内部重塑。

\n\n

今天这期日报,值得你认真读。

\n\n \n

1. Claude 5 天攻破 Apple M5 内存完整性保护

\n\n

这是今天最重要的一条新闻。

\n\n

安全研究团队 Calif 借助 Anthropic 的 Claude Mythos Preview,在 5 天内构建并演示了首个公开的、针对 Apple M5 芯片 macOS 内核的内存破坏提权利用链。攻击从普通用户权限开始,通过纯数据操作(不操纵指针)获得 root 权限,完整绕过了苹果耗时 5 年、投入数十亿美元打造的 MIE(Memory Integrity Enforcement)硬件级防护。

\n\n

\n

\n

5 天

\n

从零到完整利用链

\n

\n

\n

$10B+

\n

苹果 MIE 防护投入

\n

\n

\n

0 天

\n

AI 突破所需准备时间

\n

\n

\n\n

攻击本身不依赖零日漏洞——它利用了 MIE 允许的合法内存访问路径,通过精心排列数据操作触发内核内存破坏。这也是为什么它特别值得警惕:在防护设计者认为安全的操作空间内,AI 找到了利用路径。

\n\n

苹果在收到报告后迅速修复了漏洞并致谢研究团队。但这件事已经给整个行业敲响了警钟:AI 驱动的安全研究能力不是”未来会怎样”,而是”现在已经怎样”。

\n\n

\n

当 AI 可以用几天时间完成以前需要数月甚至数年的安全研究时,攻防平衡的天平正在被重写。这不是模型能力的问题——这是方法论的根本变化。

\n

\n\n

更多的分析讨论见今天日报的速览条目:AI API 中转站安全风险与检测差异。

\n\n \n

2. OpenAI 宣布史上最大规模重组

\n\n

OpenAI 今天发布的重组消息,比任何一次产品更新都更值得关注。

\n\n

联合创始人兼总裁 Greg Brockman 正式全面接管产品战略,成为实际掌权者。ChatGPT 原负责人 Nick Turley 被调离核心岗位。三大核心产品线——ChatGPT、Codex、API——将合并为统一组织,对齐目标是”智能体时代”。

\n\n

与此同时,Anthropic 估值飙升至 9000 亿美元,竞相谈判 300 亿新融资。两家公司的估值差距正在以季度为单位被重新定义。

\n\n

\n

\n

3 → 1

\n

产品线整合方向

\n

\n

\n

$90B

\n

Anthropic 最新估值

\n

\n

\n

“超级应用”

\n

OpenAI 秘密开发的桌面端

\n

\n

\n\n

OpenAI 这次的”超级应用”桌面端是另一个值得关注的信号——一个集成多项功能的统一入口。这与 Anthropic 的全栈推进策略形成对照:一边是产品整合,一边是能力扩张。

\n\n

另外,Anthropic CEO Dario Amodei 今天接受《华尔街日报》采访,预言软件将基本免费化,数十年来建立的许多工作和职业可能消失。”社会能应对并适应这种变化,但目前完全未意识到即将到来的变革及其巨大规模。”

\n\n \n

3. 阿里云推出 HappyHorse 视频生成模型

\n\n

阿里云今天在 Model Studio 上线了 HappyHorse——一个电影级视频生成模型。从原始提示词到 1080p 多镜头现实感画面,在统一工作流中完成。

\n\n

这个发布的产品化程度比大多数视频生成模型要高一些:不是”给你一段 5 秒视频”,而是”从提示词到多镜头完整画面”的管线。限时 8 折优惠,说明阿里云在跑量阶段。

\n\n

视频生成领域今天同时有三件事发生:HappyHorse 上线、PixVerse 的 K-Baseball 模板病毒式传播、Grok Imagine 正式发布。同一个赛道,三条完全不同的路径——开源套模板、闭源全管线、免费即用。

\n\n \n

4. 腾讯 Ardot 公测:一句话设计稿,一键转代码

\n\n

腾讯云正式公测自研 AI 设计智能体平台 Ardot。核心卖点:一句话生成可编辑设计稿,支持导入 Figma,设计稿一键转代码对接 CodeBuddy,多人在线实时协作。

\n\n

这个产品的逻辑很清晰——把设计师、产品经理和开发者的工作流压到同一个对话窗口里。输入是自然语言,输出是可运行的设计稿和代码。微信小程序即将上线。

\n\n

有意思的是,今天 Codex 也更新了键盘快捷键自定义功能。两个产品在同一件事上各自向前推了一步:设计和开发的边界正在快速消融

\n\n \n

5. 微软 AI CEO:18 个月内白领工作全自动化

\n\n

微软 AI CEO Mustafa Suleyman 在 Fortune 采访中预测:AI 将在 18 个月内达到人类水平的性能,自动化大多数专业任务,包括会计、法律、营销和项目管理。

\n\n

“所有坐在电脑前的白领工作都将被 AI 完全取代。”Suleyman 的原话就是这么直接。

\n\n

他同时透露自己的使命是构建”超级智能”,并展望未来创建新 AI 模型会像”制作播客或写博客一样便捷”。

\n\n

这种时间表预测在 AI 圈从来不少见,18 个月这个数字是否可信另说——但有趣的是发出这个预测的人正在负责微软的 AI 战略,他并不是在做学术预测,而是在描述自己正在推进的方向。

\n\n \n

6. AI 记忆系统的”忠告悖论”

\n\n

伊利诺伊大学与清华大学的研究今天发了一篇论文,结论对每个在做 AI Agent 的人都有直接参考价值。

\n\n

研究发现,LLM 智能体的记忆重写机制——把原始经历压缩成书面教训——会显著损害记忆可靠性。在 ARC 谜题等任务中,GPT-4 无记忆时 100% 准确率,建立记忆并流式更新后降至约 54%。

\n\n

问题出在:反复重写记忆导致错误分组、规则过度泛化或过拟合。智能体不是变笨了,是变得太擅长归纳,而丢了细节

\n\n

\n

原始经历应该是记忆系统的关键证据,而不是被自动压缩掉的原材料。保留原始经历 + 选择性摘要,效果优于全量重写。

\n

\n\n

这条对 Garry Tan 昨天发布的 GBrain 系统也构成了一种追问——8 层终身记忆和自我进化架构,在重写机制上的取舍会直接影响长期可靠性。

\n\n \n

7. Notion 推出开发者平台及 CLI

\n\n

Notion 正式推出开发者平台,核心组件包括 Notion CLI、Workers 计算服务、数据库同步功能和多种 Agent 工具与 API。

\n\n

产品化的方向是:开发者能在 Notion 基础设施上运行代码、连接外部数据源、构建自动化工作流。更远的愿景是——非开发者也能通过 AI Agent 在 Notion 上构建应用。

\n\n

Notion 在”以数据库为核心”和”以 AI Agent 为核心”之间找到了一个交汇点。如果这条路走通,Notion 会成为企业工作流的一个重要基础设施层。

\n\n \n

8. Figure 机器人连续自主运行第四天

\n\n

Figure 的 F.03 人形机器人进入第四天不间断自主运行测试,在真实仓库环境中 24/7 连续工作直至出现故障。

\n\n

这个测试的核心不是”能不能做一次”,而是”能不能持续做”——收集故障数据、维护需求和安全恢复机制。从”能动”到”能干”,人形机器人的实用化阶段终于有了量化的基准。

\n\n

国家人工智能应用中试基地(具身智能)今天在杭州挂牌启用,为机器人提供国家级职业技能训练场。杭州已集聚机器人企业 700 余家,2025 年产业集群产值达 1068 亿元。

\n\n \n

速览

\n\n

\n

\n

\n

\n

\n

\n

\n

\n

\n

\n

\n

\n

\n

\n

\n

\n

\n

\n

\n

\n

\n

动态 要点
Grok Imagine 发布 xAI 文本到图像模型正式上线,支持多种宽高比,所有人可用
Codex 手机端构建 ChatGPT 应用内集成 Codex,手机直接构建项目
AI API 中转站安全审计 开源工具 api-relay-audit 公开中转站”掺水/造假”检测方法
Codex 键盘快捷键自定义 支持按工作流配置快捷键,体验优化
Ring-2.6-1T 开源 万亿级推理模型上线 OpenRouter,5 月底前 75% 折扣,专为智能体工作流设计
Δ-Mem:高效在线内存 仅存储激活增量变化,内存占用减少高达 70%
Zerostack 1.0 纯 Rust 编程代理发布,Unix 哲学 + 内存安全,HN 115 点
Articraft 开源 AI 智能体全自动生成交互式 3D 资产,开源 1 万件数据集
SANA-WM NVIDIA 开源 26 亿参数世界模型,生成 1 分钟 720p 视频
GBrain 发布 Garry Tan 开源 8 层知识系统,AI Agent 终身记忆和自我进化
AI 相关岗位裁员 美国 AI 岗位出现大规模裁员,从理论讨论进入现实
OpenAI 与马耳他 向全体公民免费提供 ChatGPT Plus,国家级首例

\n\n \n

今日观察

\n\n

\n

AI 安全研究的杠杆已经被 AI 自身放大了。Claude 5 天击穿 M5 硬件防线这件事,标志性意义大于技术细节本身——以前需要数月团队协作的攻击,现在一个人加一个 AI 就能做到。防线的设计逻辑没有变,但攻防的时间差已经被压缩到接近归零。

\n

接下来值得关注的是:苹果、Google、微软的安全团队会怎么调整?是会引入 AI 辅助审计,还是继续沿用传统方法?这个问题今年就会有答案。

\n

\n\n

\n

OpenAI 和 Anthropic 都在做同一件事:把 AI 能力从模型层推到产品层和生态层。OpenAI 用组织整合把 ChatGPT、Codex、API 捏成一个整体;Anthropic 用全栈推进同时打模型、平台、生态、企业市场。两家路径不同,但目标一致——谁先把自己的产品嵌入用户的日常工作流,谁就赢了这场战争。

\n

9000 亿估值不只是市场对 Claude 的定价,更是对这场”嵌入战争”终局的提前押注。

\n

\n\n

\n

视频生成今天同时冒出了三条完全不同的路。阿里云走闭源全管线,PixVerse 走开源模板套娃,Grok Imagine 走免费即用。没有哪条路目前明显胜出,但”一键生成”这个门槛已经被 PixVerse 压到了最低——上传自拍、点击模板、出片。用户教育的成本接近零。

\n

这个赛道接下来会先拼谁的使用成本最低,再拼谁的生成质量最稳,最后拼谁能嵌入最多的创作工具链。

\n

\n\n

— 全文完 —