每日 AI 资讯速递
今日 AI 行业迎来多重重磅消息:美团开源万亿参数大模型 LongCat-2.0,在国产算力集群上完成训练;OpenAI 论文首次披露 GPT-5.6 的三个 Pro 变体,打破单一策略;Anthropic 被曝在 Claude Code 中植入隐写术代码以识别中国用户,引发信任危机。此外,Meta 计划出售过剩 AI 算力进军云计算市场,xAI 与 NVIDIA 分别推出语音智能体构建平台和新型扩散语言模型,行业格局持续演变。
🤖 大模型
美团 LongCat-2.0 正式发布:国产算力集群训练的万亿参数大模型
美团于6月30日发布并开源万亿参数大模型 LongCat-2.0,总参数达1.6T,平均激活约48B,原生支持1M超长上下文。该模型在五万卡国产算力集群上完成全流程训练与推理,采用 LSA 稀疏注意力、ScMoE 及 MOPD 多专家融合架构,SWE-bench Pro 得分59.5,预览版已通过 OpenRouter 开放,月调用量跻身平台前列。
万亿参数
开源
国产算力
OpenAI 论文揭示 GPT-5.6 三个 Pro 变体,打破单一顶级策略
OpenAI 论文首次列出 GPT-5.6 的三个 Pro 变体:Luna Pro、Terra Pro 和 Sol Pro,取代以往单一 Pro 模式。在基因组学基准中,Sol Pro 通过率31.5%居60个测试模型之首,领先标准 Sol(28.7%)和 Claude Opus 4.8(16.0%)。Pro 版本相比标准版提升逐级递减,Sol Pro 仅提升2.8个百分点,暗示顶尖模型边际效益递减。
GPT-5.6
模型变体
基准测试
NVIDIA 发布 Nemotron-Labs-TwoTower 开放权重扩散语言模型
NVIDIA 发布基于冻结自回归骨干的扩散语言模型 Nemotron-Labs-TwoTower,采用双塔架构,在 2×H100 上保留 98.7% 的 AR 基线质量,生成吞吐量提升 2.42 倍。模型总参数约 60B,每 token 活跃参数约 3B,降噪器在约 2.1T token 上训练,骨干使用 25T token 预训练,为高效推理开辟新路径。
扩散模型
开放权重
高效推理
🚀 产品发布
Claude Code v2.1.198 发布:新增后台智能体通知与 /dataviz 技能
Claude Code v2.1.198 更新,Claude in Chrome 全面可用。为 agent 新增后台智能体通知(agent_needs_input / agent_completed),新增 /dataviz 技能提供图表与仪表盘设计指导及配色验证器。后台智能体在 worktree 中完成代码后自动提交、推送并创建草稿 PR,内置 Explore 智能体现继承主会话模型上限。
Claude Code
智能体
数据可视化
xAI 发布 Voice Agent Builder 测试版:两分钟创建生产级语音智能体
xAI 推出基于 Grok Voice 的无代码平台 Voice Agent Builder 测试版,可在两分钟内创建生产级语音智能体,集成电话、知识检索、MCP 及可观测性。在 τ-voice Bench 上,Grok Voice Think Fast 1.0 得分 67.3%,大幅领先 Gemini 3.1 Flash Live(43.8%)和 GPT Realtime 1.5。
语音智能体
无代码
Grok
Acti 将 AI 智能体直接放入手机键盘,获 530 万美元种子轮融资
新加坡初创公司 Acti 发布基于 Google Gemini 的智能体键盘,通过自然语言创建快捷方式执行应用操作,如长按 T 键翻译消息。早期测试者两周内创建超 1000 个 Skills,采用本地优先架构保护隐私。公司获 530 万美元种子轮融资,由 BITKRAFT Ventures 领投,现已开放下载。
智能体键盘
Gemini
融资
Apple Creator Studio 更新:Final Cut Pro 新增 AI 驱动字幕与自动剪辑检测
Apple Creator Studio 推出多项 AI 增强更新,Final Cut Pro 新增 on-device AI 驱动的 Generate Captions(自动转录音频生成字幕)和 Edit Detection(自动检测剪辑点)。Mac 版加入 Auto Mask、增强的 Match Color 和 Advanced Trimming,支持将帧发送至 Pixelmator Pro 编辑,并在 Keynote、Pages、Numbers 中直接调用 Pixelmator 功能。
视频编辑
AI 字幕
Final Cut Pro
NotebookLM Short Video Overviews 全量上线 Web 英文版
NotebookLM 正式向 Web 英文用户全量推出 Short Video Overviews(短视频概览)功能,可将复杂资料自动转化为 60 秒竖屏视频深入讲解概念。此前该功能已面向 Google AI Ultra 和 Pro 订阅者推出,免费用户即将可用。
短视频
知识概览
💼 行业动态
Meta 效仿 SpaceX,将过剩 AI 算力变现,推出云基础设施业务
据 Bloomberg 报道,Meta 计划推出云基础设施业务 Meta Compute,对外出售 AI 计算能力和模型访问权限,直接与 AWS、Google Cloud 及 Azure 竞争。Meta 已承诺未来几年投入 1829 亿美元建设 AI 基础设施,其中俄亥俄州数据中心(规模如曼哈顿)将于今年上线。新业务由基础设施主管 Santosh Janardhan 等领导,可能效仿 CoreWeave 出售裸计算能力。
Meta
云计算
算力变现
亚马逊 AWS 砸 10 亿美元,派遣工程师进驻客户公司
亚马逊 AWS 宣布设立新部门,组建前置驻场工程师团队,先期投入 10 亿美元。团队分批派驻客户企业,每批 5-6 组工程师,驻场周期 45 天,协助客户落地人工智能软件与智能体应用。领英数据显示 2023 至 2025 年间同类岗位需求增长 42 倍,首批客户包括 NBA 与理光。
AWS
驻场工程师
企业服务
Anthropic 在 Claude Code 中植入隐写术代码识别中国用户,引发信任危机
Anthropic 被曝在 Claude Code 中植入隐写术:读取本地时区和环境变量,与经 base64+XOR 加密的 147 个域名列表(含美团、字节跳动等)比对识别中国用户。识别后修改系统提示词中的字符作为分类标记传回服务器。该隐蔽行为被社区逆向发现后引发争议,被认为严重破坏用户信任。
Anthropic
隐写术
隐私争议
库克与欧盟科技主管就新版 Siri AI 举行建设性会谈,但监管僵局未解
苹果 CEO 库克与欧盟科技事务负责人维尔库宁就新版 Siri AI 在欧推出举行建设性视频会议。新版 Siri 将转为可调用用户个人数据的聊天机器人,但因《数字市场法》互操作义务,苹果拒绝向竞争对手开放同等数据权限,暂不在欧盟推出。苹果提出“可信系统代理”方案并要求 18 个月监管宽限期,遭欧盟拒绝,欧盟收到数百封消费者邮件及死亡威胁。
苹果
Siri
欧盟监管
🔧 开源与开发工具
Google Cloud Workbench Notebooks 扩展发布:在 VS Code 中连接云端 Jupyter 环境
Google Cloud Workbench Notebooks 扩展正式上线,开发者可在 VS Code 中直接连接可扩展的云端 Jupyter 环境,无需切换上下文即可利用高性能 Google Cloud 基础设施完成机器学习全流程。该扩展已完全开源,可在 GitHub 和 VS Code Marketplace 获取。
VS Code
Jupyter
开源
智谱推出 GLM-5.2 官方开发环境 ZCode
智谱推出 GLM-5.2 的官方开发环境 ZCode,支持 macOS、Windows 和 Linux。GLM Coding Plan 订阅用户可在 ZCode 获得 1.5 倍使用配额,并支持 BYOK 与现有订阅和 API 配合使用。下载地址:zcode.z.ai/en。
GLM-5.2
开发环境
ZCode
ADK Go 2.0 发布:构建可靠的多智能体应用,新增基于图的工作流引擎
Agent Development Kit (ADK) for Go 2.0 发布,引入基于图的工作流引擎,用于组合复杂多智能体应用。新版本内置人工参与循环(HITL)编排、使用纯 Go 代码的动态执行、以及指数退避重试等自动弹性特性。单智能体应用与复杂图均运行在同一运行时上,简化了遥测与状态持久化。
多智能体
Go
工作流引擎
mattpocockuk 的《编写可预测 AI Skill》指南:三层信息结构与五种失败模式
mattpocockuk 的《writing-great-skills》成为其最常调用的 Skill,核心原则是以过程可预测为目标。指南提出三层信息结构(主步骤、参考、外部文件)实现渐进式披露,每步骤需明确完成标准,利用 leading word 压缩行为要求。同时诊断五种失败模式,如 Premature Optimization 等,为开发者编写稳定 AI Skill 提供系统方法论。
AI Skill
最佳实践
指南
📊 基础设施与架构
Meta 大规模 AI 存储蓝图:基于 Tectonic 构建 EB 级 BLOB 存储应对 GPU I/O 瓶颈
Meta 运营数百 EB 级存储集群,基于 Tectonic 分层存储层构建 BLOB 存储架构,以应对两大挑战:最大化 GPU 利用率与研究迭代速度。传统 BLOB 架构的多层元数据查询可导致数百毫秒延迟,使 GPU 因 I/O 等待停顿。新架构将训练栈逐步迁移到 BLOB 存储接口上,利用闪存提供可预测的低 pMax 延迟,避免单 GPU 慢速拖慢整批任务,并支持地理分布 GPU 间的数据高速注入。
存储架构
EB级
GPU I/O
Cloudflare 推出全新 AI 流量管理选项:区分搜索、智能体与训练爬虫
Cloudflare 为所有网站所有者提供更精细的 AI 流量管控选项,取代一刀切的屏蔽方式。用户可轻松区分并管理搜索爬虫、AI 智能体爬虫和训练爬虫,同时新增保护广告变现页面的能力,帮助网站主在 AI 时代精细化管理流量与收入。
AI 爬虫
流量管理
网站安全
构建 AI 智能体应优先设计路由:可将 AI 开销降低 90%+
行业观点指出,构建 AI 智能体时应优先设计路由(router)而非选择模型。正确路由可使 70-80% 流量运行在免费本地模型或异步推理上,将 AI 开销降低 90%+。Brian Armstrong 指出 Coinbase 通过更好的默认
安卿辰博客







