每日 AI 资讯速递
今日 AI 行业风起云涌,OpenAI 巨额亏损与产品涨价预警为行业敲响成本警钟;与此同时,Anthropic、Google 与 NVIDIA 等巨头密集发布开发者工具与前沿研究,从智能体框架到物理世界自主实验,技术迭代速度不减。此外,AI 地缘政治博弈加剧,G7 联盟的排他性提议引发广泛关注。
💼 大模型与行业动态
泄露文件显示 OpenAI 年营收 130 亿但亏损远超收入
据泄露财务文件,OpenAI 2025 年营收达 130.7 亿美元(2024 年为 37 亿),但研发成本高达 191.8 亿,其中向微软支付 105.9 亿。运营亏损达 209.2 亿,净亏损约 390 亿(扣除一次性会计费用后约 80 亿)。为控制成本,公司已关闭 Sora 视频模型并削减非核心业务。
财务OpenAI
库克:AI 浪潮引发存储芯片价格暴涨,iPhone 等苹果产品涨价已"不可避免"
苹果 CEO 库克确认,AI 热潮导致存储芯片严重短缺和价格暴涨,自 2024 年以来内存和存储芯片价格已翻四倍。研究机构估算,下一代 iPhone 18 Pro 售价或需增加约 270 美元。摩根士丹利预测,今年美国智能手机和 PC 价格将上涨 15%。
硬件涨价
Anthropic 与 DeepMind CEO 呼吁 G7 组建 AI 联盟排除中国
Dario Amodei(Anthropic)与 Demis Hassabis(Google DeepMind)在 G7 闭门会议上呼吁组建美国主导的联盟,以前沿模型和硬件访问权限为手段将中国排除在外。这一主张被评论为高技术新冷战的开端。
地缘政治G7
🚀 产品发布与更新
Claude Design 更新:跨项目保持品牌一致,与 Claude Code 协同
6 月 17 日,Claude Design 更新支持跨项目使用统一设计系统,并与 Claude Code 同步工作流。用户可直接拖拽、对齐和缩放画布元素,编辑器稳定性大幅提升。新增桌面端侧边栏入口及独立网页端,支持导出 PDF、PPT,集成 Adobe、Canva、Gamma 等工具。
设计Anthropic
Google 发布 99 美元 Gemini 智能音箱
Google 推出首款专为 Gemini 打造的智能音箱 Google Home Speaker,售价 99.99 美元。支持自然语言请求和多步指令,可在说话中途纠正,并具备连续对话功能。高级 AI 功能需订阅 Google Home Premium(月费 10 美元),即日起预售,本月发货。
硬件Google
阿里云发布 HappyOyster 1.0:一句话生成可实时交互的数字世界
6 月 17 日,阿里云发布开放式世界模型 HappyOyster 1.0(快乐生蚝)。该产品基于原生多模态架构,支持多模态输入与音视频联合生成,可在生成过程中持续接收用户指令并实时响应画面。官网开放"实时导演"与"世界探索"两种玩法,即日起至 7 月 17 日开放体验。
多模态阿里云
Claude Design 与 Replit 联动,设计变应用
用户现在可以将 Claude Design 中的设计直接发送到 Replit,将其变成一个可工作的应用。这一联动极大地简化了从设计到开发的流程,降低了原型制作的门槛。
工具集成
🔧 开发者工具与开源项目
新版本新增 `/config key=value` 语法,允许在提示中直接设置任意配置项;新增 `sandbox.allowAppleEvents` 选项和 `CLAUDE_CLIENT_PRESENCE_FILE` 环境变量。内置 Bun 运行时升级至 1.4,改进了长段落流式输出和 API 连接中断后自动重试功能。
工具Anthropic
Google 分享 A2UI 与 MCP Apps 三种集成架构模式
Google 分享了三种集成 A2UI 与 MCP Apps 的架构模式,旨在结合两者优势。A2UI 采用声明式框架,通过 JSON payload 定义 UI,由宿主原生渲染,确保一致性与安全性;MCP Apps 在 iframe 中使用标准 Web 技术提供自定义界面。三种模式包括通过 MCP 服务器提供 A2UI,实现"一次编写,原生渲染"的跨平台能力。
架构Google
借助 Workload Identity Federation 安全访问 Claude Platform
Workload Identity Federation(WIF)已在 Claude Platform 上全面可用,兼容任何 OIDC 身份提供者。WIF 用短生命期凭证替代静态 API 密钥,并引入服务账户,每个工作负载拥有独立身份、角色和审计日志,大幅提升安全性。
安全Anthropic
GitHub 发布 CC0-1.0 开源多语言仓库级数据集
GitHub 推出一个新的仓库级数据集,采用 CC0-1.0 许可证,覆盖 README、Issue 和 Pull Request 的多语言开发者内容。该数据集旨在帮助研究人员和开发者加速多语言 AI 开发。
开源数据集
Matt Pocock 开源 skills v1:将技能描述 Token 成本降低 63%
Matt Pocock(Total TypeScript 作者)开源了 skills v1,将技能描述的 Token 成本降低 63%。该工具包将技能分为模型可调用和用户可调用,新增多项技能,帮助 AI 自动判断时机触发合适工程流程。
开源效率
Vercel 发布开源 AI 智能体框架 Eve:每个智能体就是一个文件目录
Vercel 发布开源 AI 智能体框架 Eve(Apache-2.0 许可),采用文件系统优先设计:每个智能体对应一个磁盘目录,目录结构直接映射模型、指令、工具等能力,无需额外注册代码。内置持久执行、沙箱计算、人机审批等六大生产级能力。
框架智能体
Omnigent 开源:AI 智能体团队元框架
Omnigent 让你在一个实时会话中运行一个智能体团队,包括 Claude Code、Codex、Cursor、Pi 等。它是一个面向 AI 智能体的元框架,基于 Databricks 内部开发工具构建,由传奇人物 Matei Zaharia 和 Databricks AI 团队打造,现已开源。
框架Databricks
Cloudflare 发布 Cloudflare One stack:智能体驱动的部署工具集
6 月 17 日,Cloudflare 推出 Cloudflare One stack,一组可直接赋予 AI 智能体的技能文件,用于自动配置、部署和管理 Zero Trust 环境。工具集包含两个轻量级 skill,内置决策树与结构化知识,智能体可自动执行云环境评估、网络拓扑分析等任务。
安全智能体
📋 开放规范与标准
谷歌发布 Agentic Resource Discovery(ARD)开放规范
Agentic Resource Discovery(ARD)是一项开放规范,用于在 Web 上发布、发现和验证 AI 工具、技能与智能体。它基于组织在其自有域名下托管 catalog 和 registry 作为搜索引擎两个原语,支持加密验证,使客户端与端点连接前确认发布者身份。
标准发现
🎓 学术研究与前沿探索
用 SGLang-JAX 在 TPU 上优化 Ling-2.6-1T:一个 Pallas 核将 MoE 数据移动隐藏在计算中
SGLang-JAX 现已支持 Ling-2.6-1T(1T 稀疏 MoE,63B 激活参数)在 TPU v7x 上高效推理。团队开发了 Fused MoE V2 Pallas 核,将 MoE 预填充延迟从 5.16ms 降至 2.42ms(降幅 53%),解码核延迟从 0.249ms 降至 0.211ms(降幅约 15%),大幅提升吞吐量。
推理TPU
NVIDIA GEAR 实验室发布 ENPIRE:8 个 Codex 智能体自主控制机器人完成物理实验
NVIDIA GEAR 实验室推出 ENPIRE 系统,首次实现物理世界自主研究。系统让 8 个 Codex 智能体控制 8 台机器人,配备 GPU 和 token 预算,支持通宵无人运行。ENPIRE 自主完成扎带、整理细针、安装 GPU 等高精度任务,发现 8 机器人并行工作可显著提升效率。
机器人NVIDIA
MolmoMotion:语言引导的 3D 运动预测模型
MolmoMotion 基于 Molmo 2 骨干网络,输入视频帧、物体上的 3D 点标记及文字动作指令,预测未来数秒内这些点的 3D 轨迹。同时发布 MolmoMotion-1M 数据集(含 116 万视频的 3D 点轨迹及动作描述)和 PointMotionBench 基准测试,模型权重和数据集均已开源。
多模态3D
Google 医学推理 AI 系统 AMIE 新研究:从诊断迈向长期疾病管理
今日发表在《自然》杂志上的研究展示了 Google 的医学推理 AI 系统 AMIE 从单次诊断对话演进到长期疾病管理的能力。AMIE 利用 Gemini 模型的长上下文能力,可交叉引用数百页临床指南。在盲测中,AMIE 在计划精确性和指南一致性上得分显著高于 21 名初级保健医生。
医疗研究
📝 编辑点评
今日热点清晰地勾勒出 AI 行业的两极分化:一边是 OpenAI 惊人的亏损数据,揭示了"大力出奇迹"模式背后高昂的研发与推理成本,这直接导致了消费电子产品的涨价浪潮;另一边,从 Vercel 的 Eve 到 Databricks 的 Omnigent,智能体框架正从概念走向"文件系统即智能体"的工程化实践,降低开发门槛。值得注意的是,NVIDIA 的 ENPIRE 和 Google 的 AMIE 研究,分别代表了 AI 在物理世界和医疗领域的深度渗透,从自主实验到疾病管理,AI 正从"对话助手"进化为"自主行动者"。然而,G7 联盟的排他性提议也为行业蒙上地缘政治阴影,未来技术生态的割裂风险不容忽视。
安卿辰博客







