AI 日报 2026.06.19,OpenAI IPO前疯狂挖人、AI员工Viktor年入2000万、Grok语音96分
今天的新闻密度有点高。
几个最炸的我先说了,OpenAI在IPO前夕,从谷歌手里硬生生挖走了Transformer论文的共同作者Noam Shazeer,谷歌当初可是花了27亿美元把他请回来的。与此同时,AI员工Viktor带着2000万美元的年化收入,从Slack杀到了Teams。还有,Grok的语音合成盲测拿了96分,离真人就差4分。
一样一样来。
1. OpenAI IPO前连下两城,同时被曝年亏390亿
先聊最重磅的。OpenAI赶在IPO之前,一口气签下两员大将。
第一个是Noam Shazeer。这个名字在AI圈应该是如雷贯耳了,Transformer论文的共同作者,Google DeepMind的AI先驱。两年前谷歌花了27亿美元把他从一家创业公司请回来,创下了当时的个人收购纪录。结果这一轮Shazeer直接选择离开谷歌,加入OpenAI。
对Google Gemini团队来说,这消息确实有点残酷。27亿买回来的传奇大将,转头就跑去对手那了。
第二个是Dean Ball,前特朗普时期的白宫AI政策官员。Ball七月初入职,将领导OpenAI新组建的Strategic Futures团队,直接向首席战略官汇报。在IPO前安排这样一个人,信号挺明显的,OpenAI需要在华盛顿有更强的政策影响力。
说到IPO,正好有个爆炸性消息同步出来。Ars Technica曝光了一份泄露的财务文件,OpenAI 2025年营收130.7亿美元(2024年才37亿,涨得够猛),但研发成本光微软那边就烧了105.9亿,总运营亏损209.2亿。2025年净亏损大约390亿。ChatGPT周活超9亿,付费用户约5000万。
营收涨得疯,亏得更疯。为了控制成本,OpenAI已经关闭了Sora视频模型并开始砍非核心业务。上市的压力,可见一斑。
2. AI员工Viktor年入2000万美元,正式登陆Teams
下一个我觉得特别有意思,Viktor。
这哥们(或者说这个AI员工)之前只在Slack上跑,在没有销售团队、没有大规模推广的情况下,硬生生做到了2000万美元的年化收入。现在它正式进驻Microsoft Teams,直接面对Teams的3.2亿用户。
Viktor的卖点很直接,零门槛。用户不需要学习任何东西,不需要写提示词,像 @同事 一样@它就行。甚至你不需要主动@它,它也能自己把活干了。
我就觉得吧,这才是把AI放进产品里的正确姿势。不是让用户去学一个新工具,而是让AI融入用户已有的工作流。你跟同事说话不需要学什么提示词,跟AI也是。
即日起免费试用,含100次额度。
3. Grok TTS盲测96分,离真人还差4分
xAI的Grok TTS模型在Vapi_AI的Humanness Index盲测中拿了96分。
这个测试是这么玩的,选同一段语音和同一段引文,让各家模型克隆,然后给人类盲评。真人100分,Grok拿了96分。也就是说,在绝大多数人听来,它已经和真人没有区别了。
语音合成这个赛道,今年卷得是真的狠。前段时间豆包语音模型登场,现在Grok又秀了一波。AI说话这件事,快要分辨不出来了。
4. Claude Code新增artifacts,Xcode 27原生集成AI智能体
开发者工具这块今天有好几个大新闻。
Claude Code从今天起支持生成artifacts了,实时、可分享的交互式网页,基于你代码库里的全部上下文自动构建。PR走查、系统说明、发布清单、仪表盘,你说一声就有了。而且更新页面原地刷新,同事即时可见。
另一边,苹果在WWDC上发布了Xcode 27。核心组件第一次整合AI智能体,能用自然语言跟你对话,跨多个文件修改整个代码库。甚至能从零开始,根据你给的提示和资源,独立构建出一个完整的App。建成之后还能继续对话加特效、加动画。
Xcode 27还支持接入Anthropic、OpenAI和Google等第三方模型。苹果这次没有闭门造车,而是让开发者自由搭配。
怎么说呢,这两个产品放在一起看,AI编程已经从「帮你写一行代码」进化到「帮你做完一个项目」的阶段了。我今天在自己电脑上试了一下Claude Code的artifacts功能,真的有点上瘾。
5. DeepSeek识图上线,Kimi Work新增目标模式
国产模型这边也动作频频。
DeepSeek的识图模式正式上线App和网页端。跟快速模式、专家模式并列,现在可以直接上传图片让DeepSeek识别。背后的技术框架叫「Thinking with Visual Primitives(以视觉原语思考)」,今年四月公开的。网页端直接用,App端还标着「内测中」,估计很快全量。
Kimi Work(月之暗面的智能体工作台)新增了目标模式。啥意思呢?你设定一个终点,然后Agent自主循环推进任务,最长连续运行24小时。过程中你可以随时中断调整。同时上线的还有插件中心,百度网盘、Canva、钉钉、飞书、WPS、Notion、Cloudflare都能接上。六月有个福利,Kimi电脑客户端Work模式所有任务会员额度消耗减半,降到0.01%。
我最近一直在用Kimi Work跑一些数据整理的活,有了目标模式之后确实省心不少,设定好终点,让它自己跑,我隔几个小时回来看一眼就行。
6. Adobe把AI智能体塞进了全家桶
Adobe在Photoshop、Premiere、Illustrator等Creative Cloud应用里加入了AI智能体。
不是那种「一键美化」的玩具功能,是真正能理解上下文的助手。Premiere里帮你分拣素材和粗剪,Photoshop里换背景,Illustrator里批量生成文件,InDesign更新版式。Firefly也多了面向个人创作者的品牌套件、产品图转短视频等新功能。
我有个朋友是剪辑师,他说Premiere里那个时间线素材整理是最烦人的体力活。AI能帮你把这部分干了,意味着创意工作者可以把精力放在真正需要判断力的地方。
7. 伯尼·桑德斯提出7万亿美元AI计划
这个话题大了。
伯尼·桑德斯提出了一部立法,要对年AI销售额超过2亿美元的公司征收50%的股票税,用这笔钱建立一个7万亿美元的主权财富基金。然后每年向每个美国公民发放超过1000美元的股息(年化5%),同时资助医疗、教育、住房。
法案还要成立一个两党「民主AI独立委员会」,通过投票权阻止公司损害公共利益。AI公司还被要求剥离非AI业务。
怎么说呢,这个方案太桑德斯了,激进,理想主义,而且几乎不可能在共和党国会和特朗普政府手里通过。但它提出了一个很核心的问题,AI创造的价值,应该归谁?
8. 我国首部L3/L4自动驾驶强制性国标公示
工信部发布了首部针对L3/L4级别的自动驾驶强制性国标,6月16日公开征求意见,建议2027年7月1日起实施。
标准要求系统安全水平至少达到「合格且专注驾驶人」的水准,引入了Safety Case机制。L3重点规范人机交接,L4强调自身风险处置,不得依赖远程协助。
这是一个信号,自动驾驶在法规层面进入了实操阶段。从技术成熟到法规成熟,还需要时间,但已经在走了。
9. 皮尤民调,63%美国人觉得AI发展太快
最后聊一个跟技术无关、但可能比技术本身更重要的东西。皮尤研究中心的最新民调,63%的美国人认为AI发展速度过快。
ChatGPT的使用率比2023年翻了一番,44%的受访者用过了。但有意思的是,使用的人越多,担忧的人也在变多。49%的人偶尔用聊天机器人,但只有16%认为AI会有积极的社会影响。青年群体18-29岁里66%用过,但48%觉得有负面影响,仅14%看好。
用得多,但不信任。这个矛盾挺值得玩味的。可能恰恰是因为用得多,才更清楚地看到了AI的边界和问题。
Anyway,今天的日报信息量有点大。从OpenAI的IPO前奏到AI员工入驻Teams,从Grok的语音逼近人类到自动驾驶的法规破冰,每一件单独拎出来都是大新闻。
觉得有用的话,随手点个赞、在看、转发三连吧。我们明天见。
— 全文完 —