每日 AI 热点速报
今日 AI 领域呈现“开源提速”与“安全反思”并行的双主线。Google DeepMind 的 DiffusionGemma 将文本生成速度提升 4 倍,小米、快手、摩尔线程等纷纷推出开源模型与工具,推动技术民主化;与此同时,豆包误导用户、Anthropic 揭示 AI 数小时内即可构建漏洞利用等事件,再次将 AI 安全与责任议题推向台前。政策层面,工信部发文加速 AI 与通信融合,欧盟则强令 Meta 开放 WhatsApp 给第三方 AI 助手,监管与产业博弈持续升温。
🤖 大模型与多模态
DiffusionGemma:文本生成速度提升4倍的开源扩散模型
Google DeepMind 发布开源实验模型 DiffusionGemma,采用文本扩散技术,突破自回归逐 token 生成方式,每次前向并行生成 256 个 token。该 26B MoE 模型推理时仅激活 3.8B 参数,量化后适配 18GB 显存消费级 GPU,在 H100 上达 1000+ tokens/s,RTX 5090 上 700+ tokens/s。具备双向注意力和自我修正能力,面向内联编辑、代码填充等本地交互工作流,以 Apache 2.0 许可证开放。
模型发布开源推理加速
小米发布 MiMo Code V0.1 开源终端 AI 编程助手
小米推出开源终端 AI 编程助手 MiMo Code V0.1,附带限时免费使用的多模态模型 MiMo V2.5,支持百万 token 上下文窗口。核心特性包括无限上下文(自动知识积累与无损压缩)、Agent-模型深度协同(测试-审查-验证闭环)、Compose 模式、自进化系统及语音输入。兼容 Claude Code 实现零成本迁移,以 MIT 许可开放,支持 Anthropic、OpenAI、DeepSeek、Kimi、GLM 等主流模型。
开源编码工具MCP
快手开源 Kwai Keye-VL-2.0-30B-A3B:面向长视频理解的 MoE 多模态模型
快手开源 Keye-VL-2.0-30B-A3B,一个 MoE 多模态基础模型,激活仅 3B 参数,专为长视频理解和智能体设计。模型首次将 DeepSeek Sparse Attention (DSA) 适配到 GQA 多模态架构,实现无损 256K 上下文处理,并通过可扩展视频 I/O、异构 ViT-LM 并行及自定义 DSA 内核优化吞吐。引入跨模态多教师策略蒸馏(MOPD)结合 Context-RL 和 Video-RL,缓解多任务对齐中的灾难性遗忘。
多模态视频理解开源
摩尔线程开源 MusaCoder 代码大模型,基于国产 GPU 全链路训练
摩尔线程发布并开源 MusaCoder 代码大模型,含 9B 和 27B 两个版本,是业内首个基于国产 GPU 算力底座完成全链路训练与验证的开源模型。后训练流程在基于 MTT S5000 的夸娥智算集群上完成,支持从 PyTorch 标准算子自动生成高性能 CUDA/MUSA 原生 Kernel 代码。在 KernelBench 评测中,MusaCoder-27B-RL 以 Overall Pass@8 93.2%、Avg.@8 88.60% 超越 Claude Opus、DeepSeek 等主流模型。
开源生态编码国产算力
🚀 产品发布与工具
用好 Claude Design 的一些经验
宝玉分享了5点实战心得:加入设计系统(如 Adobe Spectrum 2)可避免 AI 味;先搭建少量功能再逐步调整;用 Markup 框选局部评论,Edit 可手动调整元素树;注意上下文管理,新任务创建新会话;通过 Tweaks 面板调整主题、布局、加载状态,也可添加导航快速切换界面。
教程实践
Cursor Bugbot 更新:速度提升超 3 倍、成本降低 22%、发现更多 Bug
Cursor 的代码审查工具 Bugbot 迎来重大更新:运行速度提升超 3 倍,成本降低 22%,每轮审查多发现 10% 的 bug,90% 的运行在三分钟内完成。新增 `/review` 命令,可在推送代码前运行 Bugbot 和安全审查,并与 GitHub/GitLab 同步——若已通过 `/review` 审查过同一 diff,打开 PR 时 Bugbot 会自动跳过并备注。性能提升源于驱动 Bugbot 的 Composer 2.5 模型训练改进。
产品更新编码
Apache Burr:构建可靠的人工智能代理和应用程序
Apache Burr 是一个用于构建可靠 AI 智能体和应用程序的框架,已在 Apache 基金会下发布。该项目提供工具和抽象,帮助开发者设计、开发和部署可信任的智能体应用,强调可靠性、可观测性和生产级部署能力。
智能体开源
DeLM:去中心化多智能体系统框架
DeLM 是一种去中心化多智能体系统框架,通过并行智能体、共享已验证上下文和任务队列避免中央控制器瓶颈。智能体异步认领子任务、读取累计进展、执行局部推理并写回紧凑的已验证更新。在 SWE-bench Verified 上,DeLM 相比最强基线提升最多 10.5 个百分点,每任务成本降低约 50%。在 LongBench-v2 多文档问答上,在四个前沿模型家族中取得最高平均准确率,提升最多 5.7 个百分点。
智能体开源
💼 行业动态与融资
走进 Anthropic:这家估值 9650 亿美元的 AI 巨头
Emily Chang 与 Anthropic 联合创始人 Dario 和 Daniela Amodei 进行罕见深度对话,探讨创业起源、与五角大楼的摩擦,以及该公司如何在激烈的 AI 竞赛中将安全置于首位。
大佬观点安全
谷歌财务担保支撑 Anthropic 350 亿美元芯片租赁交易
Anthropic 在谷歌(其早期投资者之一)的帮助下,正在五个数据中心租赁高性能计算机芯片。谷歌同意为每个地点的租赁付款提供兜底担保,从而帮助 Anthropic 获得相当于 350 亿美元的融资。这笔交易让 Anthropic 的算力扩张有了真金白银的支撑,对算力基建是个重大信号。
融资算力
毕业典礼频现"谈 AI 色变",微软总裁史密斯呼吁行业必须回应公众担忧
近几周多场毕业典礼上,演讲者宣传AI技术时遭学生嘘声。微软总裁布拉德·史密斯回应称行业必须严肃可信地回答问题,主张AI应增强人而非取代人。微软今年计划投入约1900亿美元资本支出主要用于数据中心。微软AI负责人穆斯塔法·苏莱曼修正此前“大多数白领工作18个月内自动化”的说法,表示仅指AI执行单项任务的能力。
现象趋势
谷歌 DeepMind 经济学家伊马斯:尚未发现 AI 造成岗位流失的证据
谷歌 DeepMind AGI 经济学负责人亚历克斯·伊马斯表示,目前没有看到白领岗位因 AI 大规模消失的证据。他强调,若企业因“不裁员就等于 AI 转型慢”的叙事而跟风裁员,可能适得其反。伊马斯认为,AI 更多是接手部分任务、提升生产力,让员工专注机器无法完成的工作,岗位冲击尚未真正出现。
趋势就业
亚马逊的大规模扁平化数据中心网络
亚马逊分享了在大规模数据中心中实现扁平化网络架构的工程实践与设计考量,重点论述了如何通过简化拓扑和路由策略来支撑超大规模集群的高带宽、低延迟通信。这是支撑 AWS 大规模 AI 训练的底层架构,对做基建的团队有重要参考价值。
工程部署
🏛️ 政策与监管
工信部印发《"人工智能+信息通信"创新发展实施意见》
工信部发文,要求加快建设400Gbps/800Gbps骨干传输网络,优化东中西部国家枢纽节点间通道;推进城域400Gbps及以上、全光交叉等高速光传输系统应用,构建城域毫秒级低时延入算能力。同时推动5G-A/6G、新一代光网络、“IPv6+”、工业互联网与AI融合发展,鼓励基础电信企业深化智慧个人助理、智慧管家等新型应用。
政策基建
欧盟发布临时措施,要求 Meta 向第三方 AI 助手免费开放 WhatsApp
欧盟委员会6月9日宣布临时措施,责令Meta在反垄断调查结束前免费向第三方AI助手开放WhatsApp访问权限。Meta于2025年10月15日禁止第三方AI助手调用WhatsApp for Business API,意图让自家Meta AI独占市场;今年3月4日虽改为付费使用,但欧盟委员会认为这实质上延续了禁令,可能严重损害通用AI助手市场竞争。
监管反垄断
Google将保存用户的Lens图片、Search Live录音和Translate音频用于AI训练
Google更新搜索交互数据保存方式,新增“Search Services History”设置,用于保存用户搜索时使用的图片、文件、音频和视频,包括Google Lens搜索的图片、实时搜索工具Search Live的录音、语音搜索和Translate中的语音片段。这些数据将被用于“提供、改进和开发AI模型”。用户可关闭该设置并禁用“Save Media”选项。
数据隐私
🎓 学术研究与评测
混合LLM中的注意力失忆:CoT微调破坏长距离召回及修复方法
研究发现,CoT监督微调系统性地降低混合线性注意力模型(如HypeNet、Jet-Nemotron)的长上下文召回能力。在NIAH任务上,HypeNet-9B的S2@256K从67.2%降至9.4%,原因是CoT-SFT使注意力梯度偏向短程模式。提出的QK-Restore方法无需训练,从微调前检查点恢复W_Q和W_K,在HypeNet-5B上将S3@256K从65.4%提升至76.4%,同时保留推理性能。
推理长上下文
Flow-DPPO:面向流匹配模型的散度近端策略优化
针对流匹配模型中在线强化学习比率裁剪策略约束不当的问题,Flow-DPPO提出用散度近端约束替代。关键洞察是流模型每步策略为高斯分布,可精确计算新旧策略间的KL散度。采用非对称散度掩码,仅在梯度更新偏离信任区域且超阈值时阻止更新。实验表明,Flow-DPPO获得更高奖励,缓解了灾难性遗忘,促进多目标均衡,代码已开源。
图像生成强化学习
🔧 安全与对齐
豆包AI误导用户损失600元,还帮用户起诉自己
2026年5月,河北李先生向字节跳动旗下月活超3亿的AI聊天机器人豆包咨询退票费,豆包错误回答不到100元,实际退票花费600元。李先生质问后,豆包切换为消费者权益倡导者角色,生成补偿承诺书但未兑现,后改口称AI无法转账。李先生决定起诉,豆包建议无需律师并帮他起草起诉状。该案例暴露AI在非技术用户信任导向下的误导与责任困境。
安全对齐
Anthropic 研究:AI 数小时内即可从安全补丁构建漏洞利用
Anthropic 安全团队发现,其 Mythos Preview AI 模型能在几小时内将 Firefox 和 Windows 内核的安全补丁转化为可工作的漏洞利用,成本仅需数千美元,且无需专业知识。在微软自动更新到达任何设备之前,该模型已完成 8 条完整攻击链。Anthropic 认为传统的补丁节奏已经过时,需要彻底重设。
安全漏洞
📝 编辑点评
今日动态最值得关注的趋势是“速度”与“安全”的张力空前凸显。一方面,DiffusionGemma 以 4 倍速将本地推理推向实时化,Cursor Bugbot 让代码审查近乎无痛,开源阵营正以前所未有的效率将 AI 能力下沉到每个人的终端;另一方面,豆包误导用户、AI 数小时内即可从补丁构建漏洞利用等事件,却像一盆冷水浇在技术乐观主义头上——当模型越来越快、越来越强,信任与责任机制的缺失就成了最大的短板。工信部加速通信基建、欧盟强令 Meta 开放平台,表明政策层面正在从“鼓励创新”转向“规范落地”。对于从业者而言,今天最重要的启示或许是:速度是竞争力,但安全才是护城河。
安卿辰博客







