欢迎光临
我们一直在努力

AI日报 | 2026年06月25日

AI Daily Digest
AI 日报

每日 AI 资讯速递

2026年06月25日 星期四

今日 AI 圈动态密集:工程岗位韧性数据出炉,证明 AI 并非取代而是重塑开发者角色;模型层迎来多项重磅更新,包括 OpenAI 双向语音模型 Bidi 1、Google 集成计算机使用的 Gemini 3.5 Flash,以及字节豆包专业版正式上线。硬件与推理效率方面,OpenAI 联合 Broadcom 发布定制芯片 Jalapeño,开源社区则涌现出 DFlash 等突破性加速方案。

🤖 🤖 大模型

GPT-5.5 Instant 新版本,对话更有趣

OpenAI 推出 GPT-5.5 Instant 更新版,改进了意图理解与复杂约束处理能力,在购物、本地推荐等场景表现更连贯。即日起向付费用户推送,明日覆盖免费用户。

📰 OpenAI / X
大模型对话升级

Gemini 3.5 Flash 集成计算机使用能力

Google 将计算机使用(Computer use)原生整合至 Gemini 3.5 Flash 主模型,开发者可通过 API 构建跨浏览器、移动端和桌面环境的智能体。该功能具备针对性对抗训练防提示注入,并新增敏感操作确认与自动停止两项企业级保护。

📰 Google
大模型智能体

Qwen-AgentWorld 开源:让 Agent 学会“先预测,再行动”

通义千问发布首个原生语言世界模型 Qwen-AgentWorld,基于超 1000 万条真实交互轨迹训练,覆盖 MCP、Search、Web 等七大领域。在 AgentWorldBench 上 Qwen-AgentWorld-397B-A17B 以 58.71 分超越 GPT-5.4 和 Claude Opus 4.8,验证了可控 Sim RL 与在线决策两种新范式。

📰 通义千问
开源世界模型

🚀 🚀 产品发布

豆包正式推出专业版,面向复杂办公场景

字节跳动旗下豆包专业版基于豆包 2.1 系列大模型上线,支持操作本地电脑、浏览器、调用 Skills 技能及生成在线应用。定价 68 元/月起(连续包月),大学生认证后仅 38 元/月,免费用户可体验 2.1 Turbo 版办公任务模式。

📰 字节跳动
产品发布办公AI

Perplexity 推出 Computer for Counsel 法律助手

Perplexity 面向法律场景推出 Computer for Counsel,连接律师常用的研究数据库、文档工具和案件管理系统,可从中提取可引用来源。所有 Pro 和 Max 订阅用户均可使用,首批集成 @midpageAI、@LegalZoom 等平台。

📰 Perplexity
产品发布法律AI

ChatGPT 语音最大规模升级:双向 AI 语音模型 Bidi 1 上线测试

部分用户发现 ChatGPT 已上线双向语音模型 Bidi 1,支持边说话边监听,可在对话中途打断并发出新指令。OpenAI 尚未官宣,预计本周启动更大范围测试,该模型与标准语音、高级语音并列于设置中。

📰 IT之家
产品发布语音交互

💼 💼 行业动态

AI 取代工程岗?新数据显示工程是 2025 年最具韧性岗位

SignalFire 追踪 8000 万家公司数据发现,大型科技公司总招聘较 2019 年下降 25%,但工程岗仅降 11%;在 Alphabet、Meta 等 12 家“Tech Majors”中,工程岗占新招员工的 55%(2019 年为 46%)。早期初创公司工程师招聘甚至增长 7%,NVIDIA 黄仁勋称 AI 让工程师更忙碌,是杰文斯悖论的典型例证。

📰 SignalFire
就业行业趋势

里德·霍夫曼批评 SpaceX 和 xAI:xAI 是“彻底的灾难”

LinkedIn 联合创始人里德·霍夫曼公开指出 SpaceX 并非 AI 公司,收购 Cursor 是“花钱买相关性”;xAI 所有 11 位联合创始人已离职,Grok 模型在基准测试中落后。他还批评美国政府以出口管制为由强制 Anthropic 下架 Fable 和 Mythos 模型。

📰 播客 / 综合
行业动态争议

Figma Config 2026 押注人类判断,画布 AI 能力来自第三方

Figma 在 Config 2026 将设计画布扩展至代码、动画、3D 深度和着色器效果,并集成 Weave 工作流系统。但其 AI 功能依赖 Anthropic、OpenAI 和 Google 等外部模型,推理成本挤压利润率,同时面临 Anthropic 等公司直接生成界面的竞争威胁。

📰 Figma
行业动态设计工具

NSA 因与 Anthropic 纠纷失去对 Mythos 系统的访问权限

美国国家安全局(NSA)因与 Anthropic 的纠纷,失去了对 Mythos 系统的访问权限。该事件凸显政府机构与 AI 公司之间在模型访问权限上的复杂关系。

📰 New York Times
行业动态政策

⚡ ⚡ 基础设施与硬件

OpenAI 与 Broadcom 发布面向 LLM 推理的定制芯片 Jalapeño

OpenAI 与 Broadcom 联合推出 Jalapeño,一款专为大语言模型推理优化的定制 AI 芯片,旨在提升性能、效率与规模。具体参数尚未披露,但标志着 OpenAI 向自研硬件迈出关键一步。

📰 OpenAI
硬件推理芯片

OpenRouter 零数据留存(ZDR)实践:97 款新模型,流量占比近半

OpenRouter 自 1 月以来新增 97 款支持 ZDR 的模型,月度 token 量增长 4.3 倍,约占全部路由流量一半。ZDR 在账户级、护栏级和单次请求级三个层面执行,企业用户可灵活选择控制粒度,避免锁定单一供应商。

📰 OpenRouter
基础设施隐私

火山引擎推出 Agent Ready 基础设施,AgentKit 与 ArkClaw 企业版升级

火山引擎在 FORCE 大会推出面向企业智能应用的 Agent Ready 基础设施,AgentKit 升级支持 Identity、Runtime、Sandbox 等模块,已接入数千家身份体系,支持分钟级 12 万沙箱并发。ArkClaw 企业版集成 Agent 广场与技能中心,海底捞门店经营 Agent 将小时级工作缩短至分钟级。

📰 火山引擎
基础设施Agent

🎓 🎓 学术研究与开源

Google Research:推理即回忆,CoT 如何解锁 LLM 中的参数化知识

Google Research 研究发现,chain-of-thought 推理能帮助 LLM 回忆简单事实,即使这些事实无需复杂推导。在 Gemini-2.5 Flash/Pro 和 Qwen3-32B 上,启用推理后模型能回答原本无法直接回答的问题,机制包括推理 token 作为计算缓冲以及事实启动效应。

📰 Google Research
学术研究推理

NVIDIA NeMo AutoModel:一行代码加速 Transformer MoE 模型微调

NVIDIA 开源 NeMo AutoModel,基于 Transformers v5 添加 Expert Parallelism、DeepEP 调度和 TransformerEngine 内核。在 MoE 模型微调中,相比原生 v5 训练吞吐量提升 3.4-3.7 倍,GPU 内存减少 29-32%,仅需改动一行 import。在 16 节点 128 张 H100 上全微调 Nemotron 3 Ultra 550B 时,v5 因内存不足无法运行。

📰 NVIDIA
开源MoE

DFlash:块扩散草稿模型实现最高 15 倍吞吐量提升

UC San Diego 团队提出 DFlash,一种用于投机解码的轻量块扩散草稿模型,一次前向推理生成整块 token 并由目标模型并行验证。相比 EAGLE-3 最高加速 2.5 倍,在 Qwen3-8B 上平均无损加速超 6 倍(MATH-500 达 6.08×)。在 NVIDIA Blackwell 上,gpt-oss-120b 模型吞吐量提升最高 15 倍。

📰 UC San Diego
学术研究推理加速

MiniCPM-V 4.6 在 Apple Core AI 上高速运行

OpenBMB 展示 MiniCPM-V 4.6 在 Apple Core AI 上以不到 2B 参数高速运行,推动高效多模态 AI 在设备端部署的进展。

📰 OpenBMB
开源多模态

🔧 🔧 开发者与工具

Notion 使用 Cursor SDK 嵌入编码智能体

Notion 通过 Cursor SDK 在数周内将编码智能体嵌入产品,用户可在文档中 @Cursor、在讨论串中提及或向数据库指派任务。集成基于 Provider 无关的智能体框架,支持 SSE 流式传输和断连恢复,让 Notion 无需自建智能体基础设施即可获得 Cursor 的完整能力。

📰 Notion / Cursor
开发者工具智能体

字节跳动技术副总裁洪定坤:AI Coding 的实践与探索

字节跳动技术副总裁洪定坤在火山引擎 Force 大会分享,过去一年字节 AI 代码贡献率增长 6 倍,但过度关注单一指标可能失真——TRAE 团队代码超 90% 由 AI 生成,人均需求吞吐率仅提升 60%。900 次实验显示主流 Coding 模型代码正确率超 80%,但可交付性仅 40-60 分,结合 Harness 基建后提升至 80 分。

📰 火山引擎
AI Coding实践

Mistral AI 为 Connectors 推出多项安全与可控新能力

Mistral AI 发布 Connectors 多项新能力:Enriched admin controls 支持按工作空间设置连接器访问权限;API keys with connector scopes 防止身份冒充;Multi-account connectors 允许单个连接器绑定多个账户;Connectors Debugger 提供端到端根因分析。

📰 Mistral AI
开发者工具安全

📝 编辑点评

今日最引人深思的信号来自就业数据:工程岗位在 AI 浪潮中展现出超乎预期的韧性,这或许是对“AI 取代论”最有力的修正。黄仁勋提到的杰文斯悖论正在成为现实——AI 非但没有让工程师失业,反而让他们的工作更繁忙、更具价值。与此同时,模型层竞争进入“集成化”阶段:Google 将计算机使用内嵌至主模型,Notion 通过 SDK 快速嫁接智能体能力,字节跳动则推出面向办公场景的专业版豆包——平台级 AI 能力正在从“可用”走向“好用”。硬件方面,OpenAI 的定制芯片 Jalapeño 与 DFlash 等开源加速方案形成呼应,推理效率的军备竞赛已全面打响。值得关注的是,Figma 的案例提醒我们:当 AI 能力依赖第三方模型时,成本与竞争风险将成为平台企业的达摩克利斯之剑。

📊 数据来源:
⚠️ 免责声明:内容整理自公开来源,仅供参考。
 收藏 (0) 打赏

您可以选择一种方式赞助本站

支付宝扫一扫赞助

微信钱包扫描赞助

未经允许不得转载:安卿辰博客 » AI日报 | 2026年06月25日

热门推荐

评论 抢沙发

安卿辰博客 专业 快捷

QUX主题是一款功能强大的收费 WordPress 主题,适配个人博客、资源分享站、资讯网站等多种场景

联系我们联系我们
切换注册

登录

忘记密码 ?

切换登录

注册