AI日报 | 2026年07月02日

AI 日报

每日 AI 资讯速递

2026年07月02日星期四

今日 AI 行业迎来多重重磅消息：美团开源万亿参数大模型 LongCat-2.0，在国产算力集群上完成训练；OpenAI 论文首次披露 GPT-5.6 的三个 Pro 变体，打破单一策略；Anthropic 被曝在 Claude Code 中植入隐写术代码以识别中国用户，引发信任危机。此外，Meta 计划出售过剩 AI 算力进军云计算市场，xAI 与 NVIDIA 分别推出语音智能体构建平台和新型扩散语言模型，行业格局持续演变。

🤖 大模型

美团 LongCat-2.0 正式发布：国产算力集群训练的万亿参数大模型

美团于6月30日发布并开源万亿参数大模型 LongCat-2.0，总参数达1.6T，平均激活约48B，原生支持1M超长上下文。该模型在五万卡国产算力集群上完成全流程训练与推理，采用 LSA 稀疏注意力、ScMoE 及 MOPD 多专家融合架构，SWE-bench Pro 得分59.5，预览版已通过 OpenRouter 开放，月调用量跻身平台前列。

📰 美团官方
万亿参数
开源
国产算力

OpenAI 论文揭示 GPT-5.6 三个 Pro 变体，打破单一顶级策略

OpenAI 论文首次列出 GPT-5.6 的三个 Pro 变体：Luna Pro、Terra Pro 和 Sol Pro，取代以往单一 Pro 模式。在基因组学基准中，Sol Pro 通过率31.5%居60个测试模型之首，领先标准 Sol（28.7%）和 Claude Opus 4.8（16.0%）。Pro 版本相比标准版提升逐级递减，Sol Pro 仅提升2.8个百分点，暗示顶尖模型边际效益递减。

📰 OpenAI 论文
GPT-5.6
模型变体
基准测试

NVIDIA 发布 Nemotron-Labs-TwoTower 开放权重扩散语言模型

NVIDIA 发布基于冻结自回归骨干的扩散语言模型 Nemotron-Labs-TwoTower，采用双塔架构，在 2×H100 上保留 98.7% 的 AR 基线质量，生成吞吐量提升 2.42 倍。模型总参数约 60B，每 token 活跃参数约 3B，降噪器在约 2.1T token 上训练，骨干使用 25T token 预训练，为高效推理开辟新路径。

📰 NVIDIA
扩散模型
开放权重
高效推理

🚀 产品发布

Claude Code v2.1.198 发布：新增后台智能体通知与 /dataviz 技能

Claude Code v2.1.198 更新，Claude in Chrome 全面可用。为 agent 新增后台智能体通知（agent_needs_input / agent_completed），新增 /dataviz 技能提供图表与仪表盘设计指导及配色验证器。后台智能体在 worktree 中完成代码后自动提交、推送并创建草稿 PR，内置 Explore 智能体现继承主会话模型上限。

📰 Anthropic
Claude Code
智能体
数据可视化

xAI 发布 Voice Agent Builder 测试版：两分钟创建生产级语音智能体

xAI 推出基于 Grok Voice 的无代码平台 Voice Agent Builder 测试版，可在两分钟内创建生产级语音智能体，集成电话、知识检索、MCP 及可观测性。在 τ-voice Bench 上，Grok Voice Think Fast 1.0 得分 67.3%，大幅领先 Gemini 3.1 Flash Live（43.8%）和 GPT Realtime 1.5。

📰 xAI
语音智能体
无代码
Grok

Acti 将 AI 智能体直接放入手机键盘，获 530 万美元种子轮融资

新加坡初创公司 Acti 发布基于 Google Gemini 的智能体键盘，通过自然语言创建快捷方式执行应用操作，如长按 T 键翻译消息。早期测试者两周内创建超 1000 个 Skills，采用本地优先架构保护隐私。公司获 530 万美元种子轮融资，由 BITKRAFT Ventures 领投，现已开放下载。

📰 TechCrunch
智能体键盘
Gemini
融资

Apple Creator Studio 更新：Final Cut Pro 新增 AI 驱动字幕与自动剪辑检测

Apple Creator Studio 推出多项 AI 增强更新，Final Cut Pro 新增 on-device AI 驱动的 Generate Captions（自动转录音频生成字幕）和 Edit Detection（自动检测剪辑点）。Mac 版加入 Auto Mask、增强的 Match Color 和 Advanced Trimming，支持将帧发送至 Pixelmator Pro 编辑，并在 Keynote、Pages、Numbers 中直接调用 Pixelmator 功能。

📰 Apple
视频编辑
AI 字幕
Final Cut Pro

NotebookLM Short Video Overviews 全量上线 Web 英文版

NotebookLM 正式向 Web 英文用户全量推出 Short Video Overviews（短视频概览）功能，可将复杂资料自动转化为 60 秒竖屏视频深入讲解概念。此前该功能已面向 Google AI Ultra 和 Pro 订阅者推出，免费用户即将可用。

📰 NotebookLM
短视频
知识概览
Google

💼 行业动态

Meta 效仿 SpaceX，将过剩 AI 算力变现，推出云基础设施业务

据 Bloomberg 报道，Meta 计划推出云基础设施业务 Meta Compute，对外出售 AI 计算能力和模型访问权限，直接与 AWS、Google Cloud 及 Azure 竞争。Meta 已承诺未来几年投入 1829 亿美元建设 AI 基础设施，其中俄亥俄州数据中心（规模如曼哈顿）将于今年上线。新业务由基础设施主管 Santosh Janardhan 等领导，可能效仿 CoreWeave 出售裸计算能力。

📰 Bloomberg
Meta
云计算
算力变现

亚马逊 AWS 砸 10 亿美元，派遣工程师进驻客户公司

亚马逊 AWS 宣布设立新部门，组建前置驻场工程师团队，先期投入 10 亿美元。团队分批派驻客户企业，每批 5-6 组工程师，驻场周期 45 天，协助客户落地人工智能软件与智能体应用。领英数据显示 2023 至 2025 年间同类岗位需求增长 42 倍，首批客户包括 NBA 与理光。

📰 IT之家
AWS
驻场工程师
企业服务

Anthropic 在 Claude Code 中植入隐写术代码识别中国用户，引发信任危机

Anthropic 被曝在 Claude Code 中植入隐写术：读取本地时区和环境变量，与经 base64+XOR 加密的 147 个域名列表（含美团、字节跳动等）比对识别中国用户。识别后修改系统提示词中的字符作为分类标记传回服务器。该隐蔽行为被社区逆向发现后引发争议，被认为严重破坏用户信任。

📰 社区逆向
Anthropic
隐写术
隐私争议

库克与欧盟科技主管就新版 Siri AI 举行建设性会谈，但监管僵局未解

苹果 CEO 库克与欧盟科技事务负责人维尔库宁就新版 Siri AI 在欧推出举行建设性视频会议。新版 Siri 将转为可调用用户个人数据的聊天机器人，但因《数字市场法》互操作义务，苹果拒绝向竞争对手开放同等数据权限，暂不在欧盟推出。苹果提出“可信系统代理”方案并要求 18 个月监管宽限期，遭欧盟拒绝，欧盟收到数百封消费者邮件及死亡威胁。

📰 IT之家
苹果
Siri
欧盟监管

🔧 开源与开发工具

Google Cloud Workbench Notebooks 扩展发布：在 VS Code 中连接云端 Jupyter 环境

Google Cloud Workbench Notebooks 扩展正式上线，开发者可在 VS Code 中直接连接可扩展的云端 Jupyter 环境，无需切换上下文即可利用高性能 Google Cloud 基础设施完成机器学习全流程。该扩展已完全开源，可在 GitHub 和 VS Code Marketplace 获取。

📰 Google 开发者博客
VS Code
Jupyter
开源

智谱推出 GLM-5.2 官方开发环境 ZCode

智谱推出 GLM-5.2 的官方开发环境 ZCode，支持 macOS、Windows 和 Linux。GLM Coding Plan 订阅用户可在 ZCode 获得 1.5 倍使用配额，并支持 BYOK 与现有订阅和 API 配合使用。下载地址：zcode.z.ai/en。

📰 智谱 AI
GLM-5.2
开发环境
ZCode

ADK Go 2.0 发布：构建可靠的多智能体应用，新增基于图的工作流引擎

Agent Development Kit (ADK) for Go 2.0 发布，引入基于图的工作流引擎，用于组合复杂多智能体应用。新版本内置人工参与循环（HITL）编排、使用纯 Go 代码的动态执行、以及指数退避重试等自动弹性特性。单智能体应用与复杂图均运行在同一运行时上，简化了遥测与状态持久化。

📰 Google 开发者博客
多智能体
Go
工作流引擎

mattpocockuk 的《编写可预测 AI Skill》指南：三层信息结构与五种失败模式

mattpocockuk 的《writing-great-skills》成为其最常调用的 Skill，核心原则是以过程可预测为目标。指南提出三层信息结构（主步骤、参考、外部文件）实现渐进式披露，每步骤需明确完成标准，利用 leading word 压缩行为要求。同时诊断五种失败模式，如 Premature Optimization 等，为开发者编写稳定 AI Skill 提供系统方法论。

📰 mattpocockuk
AI Skill
最佳实践
指南

⚠️ 免责声明：内容整理自公开来源，仅供参考。

AI日报 | 2026年07月02日

每日 AI 资讯速递

🤖 大模型

美团 LongCat-2.0 正式发布：国产算力集群训练的万亿参数大模型

OpenAI 论文揭示 GPT-5.6 三个 Pro 变体，打破单一顶级策略

NVIDIA 发布 Nemotron-Labs-TwoTower 开放权重扩散语言模型

🚀 产品发布

Claude Code v2.1.198 发布：新增后台智能体通知与 /dataviz 技能

xAI 发布 Voice Agent Builder 测试版：两分钟创建生产级语音智能体

Acti 将 AI 智能体直接放入手机键盘，获 530 万美元种子轮融资

Apple Creator Studio 更新：Final Cut Pro 新增 AI 驱动字幕与自动剪辑检测

NotebookLM Short Video Overviews 全量上线 Web 英文版

💼 行业动态

Meta 效仿 SpaceX，将过剩 AI 算力变现，推出云基础设施业务

亚马逊 AWS 砸 10 亿美元，派遣工程师进驻客户公司

Anthropic 在 Claude Code 中植入隐写术代码识别中国用户，引发信任危机

库克与欧盟科技主管就新版 Siri AI 举行建设性会谈，但监管僵局未解

🔧 开源与开发工具

Google Cloud Workbench Notebooks 扩展发布：在 VS Code 中连接云端 Jupyter 环境

智谱推出 GLM-5.2 官方开发环境 ZCode

ADK Go 2.0 发布：构建可靠的多智能体应用，新增基于图的工作流引擎

mattpocockuk 的《编写可预测 AI Skill》指南：三层信息结构与五种失败模式

📊 基础设施与架构

Meta 大规模 AI 存储蓝图：基于 Tectonic 构建 EB 级 BLOB 存储应对 GPU I/O 瓶颈

Cloudflare 推出全新 AI 流量管理选项：区分搜索、智能体与训练爬虫

构建 AI 智能体应优先设计路由：可将 AI 开销降低 90%+

您可以选择一种方式赞助本站

支付宝扫一扫赞助

微信钱包扫描赞助

相关推荐

热门推荐

评论抢沙发

安卿辰博客专业快捷

QUX主题是一款功能强大的收费 WordPress 主题，适配个人博客、资源分享站、资讯网站等多种场景

注册

QQ咨询

关注微信

回顶部

每日 AI 资讯速递

🤖 大模型

🚀 产品发布

💼 行业动态

🔧 开源与开发工具

📊 基础设施与架构

您可以选择一种方式赞助本站

支付宝扫一扫赞助

微信钱包扫描赞助

微信扫码分享

相关推荐

热门推荐

评论 抢沙发

安卿辰博客 专业 快捷

QUX主题是一款功能强大的收费 WordPress 主题，适配个人博客、资源分享站、资讯网站等多种场景

登录

注册

QQ咨询

关注微信

回顶部

评论抢沙发

安卿辰博客专业快捷