AI 日报

每日 AI 资讯速递

2026年06月25日星期四

今日 AI 圈动态密集：工程岗位韧性数据出炉，证明 AI 并非取代而是重塑开发者角色；模型层迎来多项重磅更新，包括 OpenAI 双向语音模型 Bidi 1、Google 集成计算机使用的 Gemini 3.5 Flash，以及字节豆包专业版正式上线。硬件与推理效率方面，OpenAI 联合 Broadcom 发布定制芯片 Jalapeño，开源社区则涌现出 DFlash 等突破性加速方案。

🤖 🤖 大模型

GPT-5.5 Instant 新版本，对话更有趣

OpenAI 推出 GPT-5.5 Instant 更新版，改进了意图理解与复杂约束处理能力，在购物、本地推荐等场景表现更连贯。即日起向付费用户推送，明日覆盖免费用户。

📰 OpenAI / X
大模型对话升级

Gemini 3.5 Flash 集成计算机使用能力

Google 将计算机使用（Computer use）原生整合至 Gemini 3.5 Flash 主模型，开发者可通过 API 构建跨浏览器、移动端和桌面环境的智能体。该功能具备针对性对抗训练防提示注入，并新增敏感操作确认与自动停止两项企业级保护。

📰 Google
大模型智能体

Qwen-AgentWorld 开源：让 Agent 学会“先预测，再行动”

通义千问发布首个原生语言世界模型 Qwen-AgentWorld，基于超 1000 万条真实交互轨迹训练，覆盖 MCP、Search、Web 等七大领域。在 AgentWorldBench 上 Qwen-AgentWorld-397B-A17B 以 58.71 分超越 GPT-5.4 和 Claude Opus 4.8，验证了可控 Sim RL 与在线决策两种新范式。

📰 通义千问
开源世界模型

🚀 🚀 产品发布

豆包正式推出专业版，面向复杂办公场景

字节跳动旗下豆包专业版基于豆包 2.1 系列大模型上线，支持操作本地电脑、浏览器、调用 Skills 技能及生成在线应用。定价 68 元/月起（连续包月），大学生认证后仅 38 元/月，免费用户可体验 2.1 Turbo 版办公任务模式。

📰 字节跳动
产品发布办公AI

Perplexity 推出 Computer for Counsel 法律助手

Perplexity 面向法律场景推出 Computer for Counsel，连接律师常用的研究数据库、文档工具和案件管理系统，可从中提取可引用来源。所有 Pro 和 Max 订阅用户均可使用，首批集成 @midpageAI、@LegalZoom 等平台。

📰 Perplexity
产品发布法律AI

ChatGPT 语音最大规模升级：双向 AI 语音模型 Bidi 1 上线测试

部分用户发现 ChatGPT 已上线双向语音模型 Bidi 1，支持边说话边监听，可在对话中途打断并发出新指令。OpenAI 尚未官宣，预计本周启动更大范围测试，该模型与标准语音、高级语音并列于设置中。

📰 IT之家
产品发布语音交互

💼 💼 行业动态

AI 取代工程岗？新数据显示工程是 2025 年最具韧性岗位

SignalFire 追踪 8000 万家公司数据发现，大型科技公司总招聘较 2019 年下降 25%，但工程岗仅降 11%；在 Alphabet、Meta 等 12 家“Tech Majors”中，工程岗占新招员工的 55%（2019 年为 46%）。早期初创公司工程师招聘甚至增长 7%，NVIDIA 黄仁勋称 AI 让工程师更忙碌，是杰文斯悖论的典型例证。

📰 SignalFire
就业行业趋势

里德·霍夫曼批评 SpaceX 和 xAI：xAI 是“彻底的灾难”

LinkedIn 联合创始人里德·霍夫曼公开指出 SpaceX 并非 AI 公司，收购 Cursor 是“花钱买相关性”；xAI 所有 11 位联合创始人已离职，Grok 模型在基准测试中落后。他还批评美国政府以出口管制为由强制 Anthropic 下架 Fable 和 Mythos 模型。

📰 播客 / 综合
行业动态争议

Figma Config 2026 押注人类判断，画布 AI 能力来自第三方

Figma 在 Config 2026 将设计画布扩展至代码、动画、3D 深度和着色器效果，并集成 Weave 工作流系统。但其 AI 功能依赖 Anthropic、OpenAI 和 Google 等外部模型，推理成本挤压利润率，同时面临 Anthropic 等公司直接生成界面的竞争威胁。

📰 Figma
行业动态设计工具

NSA 因与 Anthropic 纠纷失去对 Mythos 系统的访问权限

美国国家安全局（NSA）因与 Anthropic 的纠纷，失去了对 Mythos 系统的访问权限。该事件凸显政府机构与 AI 公司之间在模型访问权限上的复杂关系。

📰 New York Times
行业动态政策

⚡ ⚡ 基础设施与硬件

OpenAI 与 Broadcom 发布面向 LLM 推理的定制芯片 Jalapeño

OpenAI 与 Broadcom 联合推出 Jalapeño，一款专为大语言模型推理优化的定制 AI 芯片，旨在提升性能、效率与规模。具体参数尚未披露，但标志着 OpenAI 向自研硬件迈出关键一步。

📰 OpenAI
硬件推理芯片

OpenRouter 零数据留存（ZDR）实践：97 款新模型，流量占比近半

OpenRouter 自 1 月以来新增 97 款支持 ZDR 的模型，月度 token 量增长 4.3 倍，约占全部路由流量一半。ZDR 在账户级、护栏级和单次请求级三个层面执行，企业用户可灵活选择控制粒度，避免锁定单一供应商。

📰 OpenRouter
基础设施隐私

火山引擎推出 Agent Ready 基础设施，AgentKit 与 ArkClaw 企业版升级

火山引擎在 FORCE 大会推出面向企业智能应用的 Agent Ready 基础设施，AgentKit 升级支持 Identity、Runtime、Sandbox 等模块，已接入数千家身份体系，支持分钟级 12 万沙箱并发。ArkClaw 企业版集成 Agent 广场与技能中心，海底捞门店经营 Agent 将小时级工作缩短至分钟级。

📰 火山引擎
基础设施Agent

🎓 🎓 学术研究与开源

Google Research：推理即回忆，CoT 如何解锁 LLM 中的参数化知识

Google Research 研究发现，chain-of-thought 推理能帮助 LLM 回忆简单事实，即使这些事实无需复杂推导。在 Gemini-2.5 Flash/Pro 和 Qwen3-32B 上，启用推理后模型能回答原本无法直接回答的问题，机制包括推理 token 作为计算缓冲以及事实启动效应。

📰 Google Research
学术研究推理

NVIDIA NeMo AutoModel：一行代码加速 Transformer MoE 模型微调

NVIDIA 开源 NeMo AutoModel，基于 Transformers v5 添加 Expert Parallelism、DeepEP 调度和 TransformerEngine 内核。在 MoE 模型微调中，相比原生 v5 训练吞吐量提升 3.4-3.7 倍，GPU 内存减少 29-32%，仅需改动一行 import。在 16 节点 128 张 H100 上全微调 Nemotron 3 Ultra 550B 时，v5 因内存不足无法运行。

📰 NVIDIA
开源MoE

DFlash：块扩散草稿模型实现最高 15 倍吞吐量提升

UC San Diego 团队提出 DFlash，一种用于投机解码的轻量块扩散草稿模型，一次前向推理生成整块 token 并由目标模型并行验证。相比 EAGLE-3 最高加速 2.5 倍，在 Qwen3-8B 上平均无损加速超 6 倍（MATH-500 达 6.08×）。在 NVIDIA Blackwell 上，gpt-oss-120b 模型吞吐量提升最高 15 倍。

📰 UC San Diego
学术研究推理加速

MiniCPM-V 4.6 在 Apple Core AI 上高速运行

OpenBMB 展示 MiniCPM-V 4.6 在 Apple Core AI 上以不到 2B 参数高速运行，推动高效多模态 AI 在设备端部署的进展。

📰 OpenBMB
开源多模态

🔧 🔧 开发者与工具

Notion 使用 Cursor SDK 嵌入编码智能体

Notion 通过 Cursor SDK 在数周内将编码智能体嵌入产品，用户可在文档中 @Cursor、在讨论串中提及或向数据库指派任务。集成基于 Provider 无关的智能体框架，支持 SSE 流式传输和断连恢复，让 Notion 无需自建智能体基础设施即可获得 Cursor 的完整能力。

📰 Notion / Cursor
开发者工具智能体

字节跳动技术副总裁洪定坤：AI Coding 的实践与探索

字节跳动技术副总裁洪定坤在火山引擎 Force 大会分享，过去一年字节 AI 代码贡献率增长 6 倍，但过度关注单一指标可能失真——TRAE 团队代码超 90% 由 AI 生成，人均需求吞吐率仅提升 60%。900 次实验显示主流 Coding 模型代码正确率超 80%，但可交付性仅 40-60 分，结合 Harness 基建后提升至 80 分。

📰 火山引擎
AI Coding实践

Mistral AI 为 Connectors 推出多项安全与可控新能力

Mistral AI 发布 Connectors 多项新能力：Enriched admin controls 支持按工作空间设置连接器访问权限；API keys with connector scopes 防止身份冒充；Multi-account connectors 允许单个连接器绑定多个账户；Connectors Debugger 提供端到端根因分析。

📰 Mistral AI
开发者工具安全

📝 编辑点评

今日最引人深思的信号来自就业数据：工程岗位在 AI 浪潮中展现出超乎预期的韧性，这或许是对“AI 取代论”最有力的修正。黄仁勋提到的杰文斯悖论正在成为现实——AI 非但没有让工程师失业，反而让他们的工作更繁忙、更具价值。与此同时，模型层竞争进入“集成化”阶段：Google 将计算机使用内嵌至主模型，Notion 通过 SDK 快速嫁接智能体能力，字节跳动则推出面向办公场景的专业版豆包——平台级 AI 能力正在从“可用”走向“好用”。硬件方面，OpenAI 的定制芯片 Jalapeño 与 DFlash 等开源加速方案形成呼应，推理效率的军备竞赛已全面打响。值得关注的是，Figma 的案例提醒我们：当 AI 能力依赖第三方模型时，成本与竞争风险将成为平台企业的达摩克利斯之剑。

📊 数据来源：

⚠️ 免责声明：内容整理自公开来源，仅供参考。