今天的 AI 圈可以用一句话概括:Omni 日。Google 的 Gemini Omni 正式发布,让创意工作流第一次有了统一的 AI 入口;与此同时,Anthropic 即将历史性盈利,OpenAI 的 IPO 招股书最快本周五出炉,AI 行业最重量级的几家公司在同一个星期密集交卷。
政策端也有大动作:加州州长签署了 AI 就业保护行政令,首次把「AI 替代岗位」从学术讨论推进到公共政策层面。安全领域同样有了实打实的数字:Opus 驱动渗透测试误报率为零。今天的行业不只是「有新东西」,而是很多长期争论的事开始有了答案。
1. Gemini Omni 发布,创意作品开始涌现
Google 今天正式发布了 Gemini Omni,这是他们迄今为止最全面的多模态模型更新。不同于之前的迭代重点放在推理能力上,Omni 这次把力气花在了「通用创意」上——图像生成、视频编辑、代码可视化、交互式内容创作,全部统一到一个模型里。
官方展示了一个有趣的细节:Gemini Omni 在生成动画时可以直接理解并修改每一帧,不需要导出再导入。这个工作流从概念上简化了很多,但真正让我注意的是它在照片级真实感和风格化表达之间切换的速度——几乎没有延迟。
市场层面看,Gemini Omni 的发布时机很有意思。就在 Anthropic 宣布接近盈利的同时,Google 选择不强调成本竞争,而是把 Omni 定位成「平台级产品」——意图很明显:谁先占领创作工具链,谁就有最高的切换成本。
2. Claude Code 更新:Workflow 多智能体编排上线
Anthropic 的 Claude Code 今天发布了 v2.1.147,最引人注目的新功能是 Workflow 工具——支持确定性多智能体编排,默认关闭,需要手动开启。简单说就是:你可以在一个 Claude 会话里串联多个 Agent,让它们按预定义步骤协作,而不是每次都从头开始。
另一个实用的改动:/simplify 命令改名叫 /code-review 了,现在不仅能简化代码,还能直接指出逻辑错误,并且支持生成 GitHub PR 内线评论。这个改动听起来小,但对团队协作来说,省去了在 IDE 和 PR 页面之间来回切换的摩擦。
这次更新还修复了几个比较闹心的问题:企业登录限制没生效的 bug、Windows 下 PowerShell 工具闪烁、插件系统崩溃。这些修得越快,说明实际使用量越大。
3. ChatGPT 原生支持 PowerPoint 编辑
ChatGPT 现在可以直接在 PowerPoint 里创建和编辑演示文稿了——不是在 PowerPoint 外面生成一个 PPT 文件,而是在 PowerPoint 应用里面直接操作。目前处于测试阶段。
老实说,这个功能的价值被很多人低估了。大多数职场人做 PPT 的痛点不是「不会排版」,而是「信息量太大不知道怎么组织」——ChatGPT 天然具备信息整合能力,如果能直接在应用内编辑,等于给了一个「有理解力的排版助手」。
不过也要等正式版才能判断稳定性,毕竟演示文稿的逻辑结构比纯文本复杂得多。
4. 加州州长签署 AI 就业保护行政令
加州州长纽森今天签署了一项行政令,首次将 AI 引发的失业问题正式列为公共政策议题。要求各部门研究遣散费、就业保险、员工持股等保障措施,并建立新的劳动力数据看板来更早捕捉行业受到的冲击。
这个政策的核心思路是:AI 不是一次性取代整个岗位,而是渐进式替代岗位内的任务。这意味着被替代的部分不一定是整个工作,但累积效应可能很严重。
最有意思的一点是政策明确表示「单纯的职业培训可能无法解决根本性就业错配」——这是首次有政府文件承认 AI 替代的速度可能超过了传统再培训体系的响应能力。下一步怎么走,还在讨论,但这一步已经很有标志性意义。
5. Opus 驱动企业网络安全,误报率为零
多家企业今天分享了一组用 Claude Opus 做网络安全渗透测试的真实数据。Wiz 的 Red Agent 每周扫描超过 15 万个生产资产,发现数千个高风险漏洞,误报率为零。Palo Alto Networks 在不到三周内完成了相当于一年的渗透测试工作量。
埃森哲的案例最夸张:把安全测试覆盖率从约 10% 提到 80% 以上,涉及 1600 个应用和 50 万个 API,扫描周期从 3-5 天缩短到 1 小时以内。这是数量级的提升,不是边际改善。
这些数据指向一个事实:AI 在安全领域的落地已经从「值得关注」变成「已经在用」,而且效果相当显著。
6. Anthropic 接近历史性盈利,时间表提前两年
根据《华尔街日报》的报道,Anthropic 正接近实现其历史上第一个盈利季度,预计 Q2 营收达 109 亿美元,运营利润 5.59 亿美元。而就在去年夏天,公司的预测还是最早 2028 年才能盈利。这个转折点比预期提前了整整两年。
增长动力主要来自编程工具和 Claude 的 Agent 功能——这两块的需求一直很旺盛,但很少有人料到会旺盛到这个程度。109 亿的季度营收放在整个 AI 行业也是顶尖水平。
一个值得注意的细节:Anthropic 的盈利是在持续高投入模型训练的情况下实现的,说明单位经济模型(Unit Economics)确实跑通了。这对整个行业是个信号——AI 公司不是只能烧钱换增长。
7. 商汤连续十年领跑中国计算机视觉市场
IDC 今天发布了中国计算机视觉市场排名,商汤科技连续第十年位居第一。关键驱动因素包括:CV 2.0 架构演进、原生嵌入生成式 AI 能力、海外市场扩展至 12 个国际区域、以及以年度经常性收入增长为核心的盈利性增长路径。
在中国 AI 行业里,商汤是少有的同时具备「连续十年第一」和「年度经常性收入增长」两个指标的厂商。能连续十年保持市场领导地位的公司,放到哪个行业都不多。
8. OpenAI 最快本周五提交 IPO 招股书
据 CNBC 报道,OpenAI 最快本周五就会提交 IPO 招股书草案。CEO 萨姆·奥尔特曼设定的目标是最早 2026 年 9 月完成上市,现在正与高盛和摩根士丹利合作推进申报材料。
如果一切按计划走,这将是 AI 行业历史上规模最大的上市案之一,也是继 Anthropic 之后第二个进入资本市场的顶级 AI 实验室。两家的上市节奏几乎同步,2026 年注定是 AI 行业的「上市年」。
9. 英伟达 Q1 净利润 583 亿美元,同比增 211%
英伟达 2027 财年 Q1 财报全面刷新纪录:营业总收入 816.15 亿美元,同比增长 85%;净利润 583.21 亿美元,同比增长 211%;数据中心业务营收 752 亿美元,同比增长 92%。毛利率提升至 74.9%,并宣布了 800 亿美元的进一步回购计划。
把这些数字翻译一下:英伟达一个季度的净利润超过了很多 AI 公司全年的营收。数据中心的增速(92%)略低于整体增速,说明游戏和汽车等其他业务也在加速。
唯一需要警惕的是:583 亿美元的净利润是在全球算力需求持续爆发的背景下实现的,一旦需求周期见顶,这样的增速会很难持续。但目前没有任何迹象表明算力需求会很快见顶。
10. 速览
| 动态 | 要点 |
|---|---|
| 腾讯开源 Hy-MT2 多语言翻译模型 | 1.8B 轻量版性能超越微软商业 API,440MB 可在手机本地运行 |
| Replit 企业版开放自助购买 | 几分钟内自助配置 SSO + SCIM,无需合同谈判 |
| Cloudflare CEO:AI 替代员工的决策逻辑 | 在《华尔街日报》撰文分享判断标准,HN 获 100+ 点赞 |
| Gemini for Home 发布 | Google 全栈智能家居 AI 方案,含摄像头智能与日常活动摘要 |
| Grok Imagine + OpenCode | xAI SuperGrok 用户现可在 OpenCode 中使用 Grok 模型 |
| OpenClaw 2026.5.19 | Android Talk Mode 实时化、Mac 设置界面刷新、xAI 无头登录 |
| Aleph 2.0 发布 | Runway 多模态创作工具,生成→编辑→后期一体化 |
| Krea 2 推出 LoRA 微调 | 支持在 Krea 2 上训练自定义风格/角色/对象 |
| FSD 正式登陆中国大陆 | 特斯拉全自动驾驶进入中国市场 |
| SpaceX 与 Anthropic 合作提供 AI 算力 | 大规模 AI 算力服务,未来或将拓展至轨道数据中心 |
今日观察
今天三条主线:
Anthropic 的盈利转折改变了整个行业的叙事。
之前 AI 公司盈利是「迟早的事」,现在是「已经发生」。2026 年注定成为 AI 商业化从烧钱到赚钱的分水岭。
AI 在安全领域的落地速度超出预期。
从渗透测试到漏洞修复,整个工作流已经在用 AI 加速。安全不是 AI 的下一个市场,它已经是当下最成熟的企业级应用场景之一。
Agent 编排正从概念变成可用工具。
Claude Code 的 Workflow、Gemini Omni 的多模态统一、ChatGPT 的 PowerPoint 集成——Agent 正在从「单步操作」进化成「多步工作流」,这是采用率开始爆发的前兆。
(完)