每日 AI 资讯速递
今日 AI 圈动态密集:工程岗位韧性数据出炉,证明 AI 并非取代而是重塑开发者角色;模型层迎来多项重磅更新,包括 OpenAI 双向语音模型 Bidi 1、Google 集成计算机使用的 Gemini 3.5 Flash,以及字节豆包专业版正式上线。硬件与推理效率方面,OpenAI 联合 Broadcom 发布定制芯片 Jalapeño,开源社区则涌现出 DFlash 等突破性加速方案。
🤖 🤖 大模型
GPT-5.5 Instant 新版本,对话更有趣
OpenAI 推出 GPT-5.5 Instant 更新版,改进了意图理解与复杂约束处理能力,在购物、本地推荐等场景表现更连贯。即日起向付费用户推送,明日覆盖免费用户。
大模型对话升级
Gemini 3.5 Flash 集成计算机使用能力
Google 将计算机使用(Computer use)原生整合至 Gemini 3.5 Flash 主模型,开发者可通过 API 构建跨浏览器、移动端和桌面环境的智能体。该功能具备针对性对抗训练防提示注入,并新增敏感操作确认与自动停止两项企业级保护。
大模型智能体
Qwen-AgentWorld 开源:让 Agent 学会“先预测,再行动”
通义千问发布首个原生语言世界模型 Qwen-AgentWorld,基于超 1000 万条真实交互轨迹训练,覆盖 MCP、Search、Web 等七大领域。在 AgentWorldBench 上 Qwen-AgentWorld-397B-A17B 以 58.71 分超越 GPT-5.4 和 Claude Opus 4.8,验证了可控 Sim RL 与在线决策两种新范式。
开源世界模型
🚀 🚀 产品发布
豆包正式推出专业版,面向复杂办公场景
字节跳动旗下豆包专业版基于豆包 2.1 系列大模型上线,支持操作本地电脑、浏览器、调用 Skills 技能及生成在线应用。定价 68 元/月起(连续包月),大学生认证后仅 38 元/月,免费用户可体验 2.1 Turbo 版办公任务模式。
产品发布办公AI
Perplexity 推出 Computer for Counsel 法律助手
Perplexity 面向法律场景推出 Computer for Counsel,连接律师常用的研究数据库、文档工具和案件管理系统,可从中提取可引用来源。所有 Pro 和 Max 订阅用户均可使用,首批集成 @midpageAI、@LegalZoom 等平台。
产品发布法律AI
ChatGPT 语音最大规模升级:双向 AI 语音模型 Bidi 1 上线测试
部分用户发现 ChatGPT 已上线双向语音模型 Bidi 1,支持边说话边监听,可在对话中途打断并发出新指令。OpenAI 尚未官宣,预计本周启动更大范围测试,该模型与标准语音、高级语音并列于设置中。
产品发布语音交互
💼 💼 行业动态
AI 取代工程岗?新数据显示工程是 2025 年最具韧性岗位
SignalFire 追踪 8000 万家公司数据发现,大型科技公司总招聘较 2019 年下降 25%,但工程岗仅降 11%;在 Alphabet、Meta 等 12 家“Tech Majors”中,工程岗占新招员工的 55%(2019 年为 46%)。早期初创公司工程师招聘甚至增长 7%,NVIDIA 黄仁勋称 AI 让工程师更忙碌,是杰文斯悖论的典型例证。
就业行业趋势
里德·霍夫曼批评 SpaceX 和 xAI:xAI 是“彻底的灾难”
LinkedIn 联合创始人里德·霍夫曼公开指出 SpaceX 并非 AI 公司,收购 Cursor 是“花钱买相关性”;xAI 所有 11 位联合创始人已离职,Grok 模型在基准测试中落后。他还批评美国政府以出口管制为由强制 Anthropic 下架 Fable 和 Mythos 模型。
行业动态争议
Figma Config 2026 押注人类判断,画布 AI 能力来自第三方
Figma 在 Config 2026 将设计画布扩展至代码、动画、3D 深度和着色器效果,并集成 Weave 工作流系统。但其 AI 功能依赖 Anthropic、OpenAI 和 Google 等外部模型,推理成本挤压利润率,同时面临 Anthropic 等公司直接生成界面的竞争威胁。
行业动态设计工具
NSA 因与 Anthropic 纠纷失去对 Mythos 系统的访问权限
美国国家安全局(NSA)因与 Anthropic 的纠纷,失去了对 Mythos 系统的访问权限。该事件凸显政府机构与 AI 公司之间在模型访问权限上的复杂关系。
行业动态政策
⚡ ⚡ 基础设施与硬件
OpenAI 与 Broadcom 发布面向 LLM 推理的定制芯片 Jalapeño
OpenAI 与 Broadcom 联合推出 Jalapeño,一款专为大语言模型推理优化的定制 AI 芯片,旨在提升性能、效率与规模。具体参数尚未披露,但标志着 OpenAI 向自研硬件迈出关键一步。
硬件推理芯片
OpenRouter 零数据留存(ZDR)实践:97 款新模型,流量占比近半
OpenRouter 自 1 月以来新增 97 款支持 ZDR 的模型,月度 token 量增长 4.3 倍,约占全部路由流量一半。ZDR 在账户级、护栏级和单次请求级三个层面执行,企业用户可灵活选择控制粒度,避免锁定单一供应商。
基础设施隐私
火山引擎推出 Agent Ready 基础设施,AgentKit 与 ArkClaw 企业版升级
火山引擎在 FORCE 大会推出面向企业智能应用的 Agent Ready 基础设施,AgentKit 升级支持 Identity、Runtime、Sandbox 等模块,已接入数千家身份体系,支持分钟级 12 万沙箱并发。ArkClaw 企业版集成 Agent 广场与技能中心,海底捞门店经营 Agent 将小时级工作缩短至分钟级。
基础设施Agent
🎓 🎓 学术研究与开源
Google Research:推理即回忆,CoT 如何解锁 LLM 中的参数化知识
Google Research 研究发现,chain-of-thought 推理能帮助 LLM 回忆简单事实,即使这些事实无需复杂推导。在 Gemini-2.5 Flash/Pro 和 Qwen3-32B 上,启用推理后模型能回答原本无法直接回答的问题,机制包括推理 token 作为计算缓冲以及事实启动效应。
学术研究推理
NVIDIA NeMo AutoModel:一行代码加速 Transformer MoE 模型微调
NVIDIA 开源 NeMo AutoModel,基于 Transformers v5 添加 Expert Parallelism、DeepEP 调度和 TransformerEngine 内核。在 MoE 模型微调中,相比原生 v5 训练吞吐量提升 3.4-3.7 倍,GPU 内存减少 29-32%,仅需改动一行 import。在 16 节点 128 张 H100 上全微调 Nemotron 3 Ultra 550B 时,v5 因内存不足无法运行。
开源MoE
DFlash:块扩散草稿模型实现最高 15 倍吞吐量提升
UC San Diego 团队提出 DFlash,一种用于投机解码的轻量块扩散草稿模型,一次前向推理生成整块 token 并由目标模型并行验证。相比 EAGLE-3 最高加速 2.5 倍,在 Qwen3-8B 上平均无损加速超 6 倍(MATH-500 达 6.08×)。在 NVIDIA Blackwell 上,gpt-oss-120b 模型吞吐量提升最高 15 倍。
学术研究推理加速
MiniCPM-V 4.6 在 Apple Core AI 上高速运行
OpenBMB 展示 MiniCPM-V 4.6 在 Apple Core AI 上以不到 2B 参数高速运行,推动高效多模态 AI 在设备端部署的进展。
开源多模态
🔧 🔧 开发者与工具
Notion 使用 Cursor SDK 嵌入编码智能体
Notion 通过 Cursor SDK 在数周内将编码智能体嵌入产品,用户可在文档中 @Cursor、在讨论串中提及或向数据库指派任务。集成基于 Provider 无关的智能体框架,支持 SSE 流式传输和断连恢复,让 Notion 无需自建智能体基础设施即可获得 Cursor 的完整能力。
开发者工具智能体
字节跳动技术副总裁洪定坤:AI Coding 的实践与探索
字节跳动技术副总裁洪定坤在火山引擎 Force 大会分享,过去一年字节 AI 代码贡献率增长 6 倍,但过度关注单一指标可能失真——TRAE 团队代码超 90% 由 AI 生成,人均需求吞吐率仅提升 60%。900 次实验显示主流 Coding 模型代码正确率超 80%,但可交付性仅 40-60 分,结合 Harness 基建后提升至 80 分。
AI Coding实践
Mistral AI 为 Connectors 推出多项安全与可控新能力
Mistral AI 发布 Connectors 多项新能力:Enriched admin controls 支持按工作空间设置连接器访问权限;API keys with connector scopes 防止身份冒充;Multi-account connectors 允许单个连接器绑定多个账户;Connectors Debugger 提供端到端根因分析。
开发者工具安全
📝 编辑点评
今日最引人深思的信号来自就业数据:工程岗位在 AI 浪潮中展现出超乎预期的韧性,这或许是对“AI 取代论”最有力的修正。黄仁勋提到的杰文斯悖论正在成为现实——AI 非但没有让工程师失业,反而让他们的工作更繁忙、更具价值。与此同时,模型层竞争进入“集成化”阶段:Google 将计算机使用内嵌至主模型,Notion 通过 SDK 快速嫁接智能体能力,字节跳动则推出面向办公场景的专业版豆包——平台级 AI 能力正在从“可用”走向“好用”。硬件方面,OpenAI 的定制芯片 Jalapeño 与 DFlash 等开源加速方案形成呼应,推理效率的军备竞赛已全面打响。值得关注的是,Figma 的案例提醒我们:当 AI 能力依赖第三方模型时,成本与竞争风险将成为平台企业的达摩克利斯之剑。
安卿辰博客







