欢迎光临
我们一直在努力

AI日报 | 2026年07月02日

AI Daily Digest
AI 日报

每日 AI 资讯速递

2026年07月02日 星期四

今日 AI 行业迎来多重重磅消息:美团开源万亿参数大模型 LongCat-2.0,在国产算力集群上完成训练;OpenAI 论文首次披露 GPT-5.6 的三个 Pro 变体,打破单一策略;Anthropic 被曝在 Claude Code 中植入隐写术代码以识别中国用户,引发信任危机。此外,Meta 计划出售过剩 AI 算力进军云计算市场,xAI 与 NVIDIA 分别推出语音智能体构建平台和新型扩散语言模型,行业格局持续演变。

🤖 大模型

美团 LongCat-2.0 正式发布:国产算力集群训练的万亿参数大模型

美团于6月30日发布并开源万亿参数大模型 LongCat-2.0,总参数达1.6T,平均激活约48B,原生支持1M超长上下文。该模型在五万卡国产算力集群上完成全流程训练与推理,采用 LSA 稀疏注意力、ScMoE 及 MOPD 多专家融合架构,SWE-bench Pro 得分59.5,预览版已通过 OpenRouter 开放,月调用量跻身平台前列。

📰 美团官方
万亿参数
开源
国产算力

OpenAI 论文揭示 GPT-5.6 三个 Pro 变体,打破单一顶级策略

OpenAI 论文首次列出 GPT-5.6 的三个 Pro 变体:Luna Pro、Terra Pro 和 Sol Pro,取代以往单一 Pro 模式。在基因组学基准中,Sol Pro 通过率31.5%居60个测试模型之首,领先标准 Sol(28.7%)和 Claude Opus 4.8(16.0%)。Pro 版本相比标准版提升逐级递减,Sol Pro 仅提升2.8个百分点,暗示顶尖模型边际效益递减。

📰 OpenAI 论文
GPT-5.6
模型变体
基准测试

NVIDIA 发布 Nemotron-Labs-TwoTower 开放权重扩散语言模型

NVIDIA 发布基于冻结自回归骨干的扩散语言模型 Nemotron-Labs-TwoTower,采用双塔架构,在 2×H100 上保留 98.7% 的 AR 基线质量,生成吞吐量提升 2.42 倍。模型总参数约 60B,每 token 活跃参数约 3B,降噪器在约 2.1T token 上训练,骨干使用 25T token 预训练,为高效推理开辟新路径。

📰 NVIDIA
扩散模型
开放权重
高效推理

🚀 产品发布

Claude Code v2.1.198 发布:新增后台智能体通知与 /dataviz 技能

Claude Code v2.1.198 更新,Claude in Chrome 全面可用。为 agent 新增后台智能体通知(agent_needs_input / agent_completed),新增 /dataviz 技能提供图表与仪表盘设计指导及配色验证器。后台智能体在 worktree 中完成代码后自动提交、推送并创建草稿 PR,内置 Explore 智能体现继承主会话模型上限。

📰 Anthropic
Claude Code
智能体
数据可视化

xAI 发布 Voice Agent Builder 测试版:两分钟创建生产级语音智能体

xAI 推出基于 Grok Voice 的无代码平台 Voice Agent Builder 测试版,可在两分钟内创建生产级语音智能体,集成电话、知识检索、MCP 及可观测性。在 τ-voice Bench 上,Grok Voice Think Fast 1.0 得分 67.3%,大幅领先 Gemini 3.1 Flash Live(43.8%)和 GPT Realtime 1.5。

📰 xAI
语音智能体
无代码
Grok

Acti 将 AI 智能体直接放入手机键盘,获 530 万美元种子轮融资

新加坡初创公司 Acti 发布基于 Google Gemini 的智能体键盘,通过自然语言创建快捷方式执行应用操作,如长按 T 键翻译消息。早期测试者两周内创建超 1000 个 Skills,采用本地优先架构保护隐私。公司获 530 万美元种子轮融资,由 BITKRAFT Ventures 领投,现已开放下载。

📰 TechCrunch
智能体键盘
Gemini
融资

Apple Creator Studio 更新:Final Cut Pro 新增 AI 驱动字幕与自动剪辑检测

Apple Creator Studio 推出多项 AI 增强更新,Final Cut Pro 新增 on-device AI 驱动的 Generate Captions(自动转录音频生成字幕)和 Edit Detection(自动检测剪辑点)。Mac 版加入 Auto Mask、增强的 Match Color 和 Advanced Trimming,支持将帧发送至 Pixelmator Pro 编辑,并在 Keynote、Pages、Numbers 中直接调用 Pixelmator 功能。

📰 Apple
视频编辑
AI 字幕
Final Cut Pro

NotebookLM Short Video Overviews 全量上线 Web 英文版

NotebookLM 正式向 Web 英文用户全量推出 Short Video Overviews(短视频概览)功能,可将复杂资料自动转化为 60 秒竖屏视频深入讲解概念。此前该功能已面向 Google AI Ultra 和 Pro 订阅者推出,免费用户即将可用。

📰 NotebookLM
短视频
知识概览
Google

💼 行业动态

Meta 效仿 SpaceX,将过剩 AI 算力变现,推出云基础设施业务

据 Bloomberg 报道,Meta 计划推出云基础设施业务 Meta Compute,对外出售 AI 计算能力和模型访问权限,直接与 AWS、Google Cloud 及 Azure 竞争。Meta 已承诺未来几年投入 1829 亿美元建设 AI 基础设施,其中俄亥俄州数据中心(规模如曼哈顿)将于今年上线。新业务由基础设施主管 Santosh Janardhan 等领导,可能效仿 CoreWeave 出售裸计算能力。

📰 Bloomberg
Meta
云计算
算力变现

亚马逊 AWS 砸 10 亿美元,派遣工程师进驻客户公司

亚马逊 AWS 宣布设立新部门,组建前置驻场工程师团队,先期投入 10 亿美元。团队分批派驻客户企业,每批 5-6 组工程师,驻场周期 45 天,协助客户落地人工智能软件与智能体应用。领英数据显示 2023 至 2025 年间同类岗位需求增长 42 倍,首批客户包括 NBA 与理光。

📰 IT之家
AWS
驻场工程师
企业服务

Anthropic 在 Claude Code 中植入隐写术代码识别中国用户,引发信任危机

Anthropic 被曝在 Claude Code 中植入隐写术:读取本地时区和环境变量,与经 base64+XOR 加密的 147 个域名列表(含美团、字节跳动等)比对识别中国用户。识别后修改系统提示词中的字符作为分类标记传回服务器。该隐蔽行为被社区逆向发现后引发争议,被认为严重破坏用户信任。

📰 社区逆向
Anthropic
隐写术
隐私争议

库克与欧盟科技主管就新版 Siri AI 举行建设性会谈,但监管僵局未解

苹果 CEO 库克与欧盟科技事务负责人维尔库宁就新版 Siri AI 在欧推出举行建设性视频会议。新版 Siri 将转为可调用用户个人数据的聊天机器人,但因《数字市场法》互操作义务,苹果拒绝向竞争对手开放同等数据权限,暂不在欧盟推出。苹果提出“可信系统代理”方案并要求 18 个月监管宽限期,遭欧盟拒绝,欧盟收到数百封消费者邮件及死亡威胁。

📰 IT之家
苹果
Siri
欧盟监管

🔧 开源与开发工具

Google Cloud Workbench Notebooks 扩展发布:在 VS Code 中连接云端 Jupyter 环境

Google Cloud Workbench Notebooks 扩展正式上线,开发者可在 VS Code 中直接连接可扩展的云端 Jupyter 环境,无需切换上下文即可利用高性能 Google Cloud 基础设施完成机器学习全流程。该扩展已完全开源,可在 GitHub 和 VS Code Marketplace 获取。

📰 Google 开发者博客
VS Code
Jupyter
开源

智谱推出 GLM-5.2 官方开发环境 ZCode

智谱推出 GLM-5.2 的官方开发环境 ZCode,支持 macOS、Windows 和 Linux。GLM Coding Plan 订阅用户可在 ZCode 获得 1.5 倍使用配额,并支持 BYOK 与现有订阅和 API 配合使用。下载地址:zcode.z.ai/en。

📰 智谱 AI
GLM-5.2
开发环境
ZCode

ADK Go 2.0 发布:构建可靠的多智能体应用,新增基于图的工作流引擎

Agent Development Kit (ADK) for Go 2.0 发布,引入基于图的工作流引擎,用于组合复杂多智能体应用。新版本内置人工参与循环(HITL)编排、使用纯 Go 代码的动态执行、以及指数退避重试等自动弹性特性。单智能体应用与复杂图均运行在同一运行时上,简化了遥测与状态持久化。

📰 Google 开发者博客
多智能体
Go
工作流引擎

mattpocockuk 的《编写可预测 AI Skill》指南:三层信息结构与五种失败模式

mattpocockuk 的《writing-great-skills》成为其最常调用的 Skill,核心原则是以过程可预测为目标。指南提出三层信息结构(主步骤、参考、外部文件)实现渐进式披露,每步骤需明确完成标准,利用 leading word 压缩行为要求。同时诊断五种失败模式,如 Premature Optimization 等,为开发者编写稳定 AI Skill 提供系统方法论。

📰 mattpocockuk
AI Skill
最佳实践
指南

📊 基础设施与架构

Meta 大规模 AI 存储蓝图:基于 Tectonic 构建 EB 级 BLOB 存储应对 GPU I/O 瓶颈

Meta 运营数百 EB 级存储集群,基于 Tectonic 分层存储层构建 BLOB 存储架构,以应对两大挑战:最大化 GPU 利用率与研究迭代速度。传统 BLOB 架构的多层元数据查询可导致数百毫秒延迟,使 GPU 因 I/O 等待停顿。新架构将训练栈逐步迁移到 BLOB 存储接口上,利用闪存提供可预测的低 pMax 延迟,避免单 GPU 慢速拖慢整批任务,并支持地理分布 GPU 间的数据高速注入。

📰 Meta Engineering
存储架构
EB级
GPU I/O

Cloudflare 推出全新 AI 流量管理选项:区分搜索、智能体与训练爬虫

Cloudflare 为所有网站所有者提供更精细的 AI 流量管控选项,取代一刀切的屏蔽方式。用户可轻松区分并管理搜索爬虫、AI 智能体爬虫和训练爬虫,同时新增保护广告变现页面的能力,帮助网站主在 AI 时代精细化管理流量与收入。

📰 Cloudflare 博客
AI 爬虫
流量管理
网站安全

构建 AI 智能体应优先设计路由:可将 AI 开销降低 90%+

行业观点指出,构建 AI 智能体时应优先设计路由(router)而非选择模型。正确路由可使 70-80% 流量运行在免费本地模型或异步推理上,将 AI 开销降低 90%+。Brian Armstrong 指出 Coinbase 通过更好的默认

📊 数据来源:
⚠️ 免责声明:内容整理自公开来源,仅供参考。
 收藏 (0) 打赏

您可以选择一种方式赞助本站

支付宝扫一扫赞助

微信钱包扫描赞助

未经允许不得转载:安卿辰博客 » AI日报 | 2026年07月02日

热门推荐

评论 抢沙发

安卿辰博客 专业 快捷

QUX主题是一款功能强大的收费 WordPress 主题,适配个人博客、资源分享站、资讯网站等多种场景

联系我们联系我们
切换注册

登录

忘记密码 ?

切换登录

注册