每日 AI 资讯速递
今日 AI 领域迎来多项重磅动态:自主武器系统首次在实战中完成致命攻击,引发全球对伦理与监管的紧迫讨论;同时,技术落地层面,腾讯混元开源了大幅提升推理性能的核心算子库,小米则低调发布并开源了终端编程助手 MiMo Code。此外,Anthropic 与 DXC 达成企业级战略联盟,而贝佐斯旗下公司 Prometheus 以 410 亿美元估值完成 120 亿美元融资,展现了资本对“人工通用工程师”愿景的豪赌。
⚡ 大模型与基础设施
腾讯混元 AI Infra 新开源:HPC-Ops 推理核心算子全面升级
腾讯混元 AI Infra 团队开源升级 HPC-Ops 推理算子库,推出五大核心算子。其中 Attention 采用运行时动态负载调度,长文本最高加速 2.95x,端到端 QPM 提升 17%;FusedMoE 相对 vLLM 性能提升 1.2x~1.6x;Sampler 算子解码采样速度更是比 vLLM 快 4-7 倍。
推理部署开源
DeepSeek-R1 的开源实现
Hugging Face 在 GitHub 上发布了 DeepSeek-R1 的开源复现项目,旨在实现推理模型的完全透明化。该项目已公开训练代码和权重,为强化学习和推理优化的研究提供了可直接使用的基线。
开源推理
🚀 产品发布与更新
小米发布并开源终端AI编程助手MiMo Code V0.1.0,采用MIT协议
小米开源了终端 AI 编程助手 MiMo Code V0.1.0,内置限时免费的 MiMo-V2.5 多模态模型,性能宣称比肩 Claude Sonnet 4.6。其独创的 Compose 模式实现了模型与 Agent 协同优化,在 SWE-Bench Pro 上达到 62%,超越 Claude Code 的 57%。
开源编程助手
baoyu-design skill 更新:支持导入 Figma 本地文件重建设计系统
baoyu-design 工具迎来重要更新,现在可以直接导入 Figma 本地文件(.fig),在本地重建设计系统。该功能依赖 Claude Fable 5 辅助,安装后提供 Figma 文件路径即可导入,后续新建设计项目可复用,极大简化了前端和设计团队的重复劳动。
多模态设计工具
Codex Goal指令生成Skill发布:一句话需求转目标
针对 Codex 编程中 Goal 指令编写困难的问题,开发者发布了一款 Skill,可将一句话需求自动转化为高标准的开发目标。该工具旨在实现“睡前写指令、模型自动开发、第二天收菜”的自动化工作流,源码已免费开源。
智能体编码
Cursor 推出 Auto-review 机制:用分类器智能体动态管控智能体自主权限
Cursor 推出 Auto-review 功能,通过一个专门的分类器智能体在工具调用前审查动作风险。该分类器采用小模型,能根据上下文判断动作是否与用户意图一致,高风险时阻止并返回解释。设计目标是在不频繁打断日常开发的前提下,拦截读取密钥、操作生产数据等危险动作。
安全智能体
xAI 推出 Grok Build Plugin Marketplace
xAI 发布了 Grok Build 的内置插件市场,将技能、斜杠命令、MCP 服务器等打包为可安装包。首发合作伙伴包括 MongoDB、Vercel、Sentry 等,用户无需离开终端即可浏览和安装插件,每个远程插件均经过验证并固定到特定 commit SHA。
MCP开发者工具
阿里云发布 Meoo CLI:本地 AI 编程项目可一键部署上线
阿里云推出开源命令行工具 Meoo CLI,支持 Claude Code、Codex、Cursor 等本地 AI 编程助手。该工具可自动完成数据库接入、用户登录、文件存储及项目发布,将本地项目一键部署上线并生成可分享的访问链接,定位为本地 Agent 与云端能力的连接入口。
部署开源
千问推出首个足球预测AI助手,竞猜赢奖并捐建球场
千问上线足球预测 AI 助手,基于海量历史比赛、球员数据及天气地貌数据。活动覆盖全部 104 场竞猜,预测准确率超千问的用户可抽万元大奖和 AI 眼镜 G1。此外,累积积分将用于向乡村学校捐建足球场,目标至少 50 所。
数据应用
Deezer 推出面向其他流媒体服务的 AI 音乐检测器
Deezer 推出了跨平台 AI 音乐检测工具,用户可扫描其在 Spotify、Apple Music 等其他平台的播放列表,检测其中是否包含 AI 生成音乐。此前 Deezer 已向其他平台提供该技术但少有采纳,此次决定直接面向终端用户开放。
语音内容审核
💼 行业动态与投资
Prometheus融资120亿美元,估值410亿美元,定位"人工通用工程师"
杰夫·贝佐斯旗下 AI 公司 Prometheus 在成立仅 7 个月、尚无产品交付的情况下,以 410 亿美元估值完成 120 亿美元融资。该公司计划斥资 1000 亿美元收购传统工业企业,以获取真实制造数据来训练物理 AI,构建数据护城河。
融资具身智能
Anthropic与DXC达成全球联盟,将Claude引入关键行业系统
Anthropic 与 IT 服务巨头 DXC Technology 达成多年全球联盟,将培训数万名获得 Claude 认证的前沿部署工程师。Claude 已成为 DXC OASIS 平台的默认基础模型,该平台超 95% 代码由 Claude 编写,开发速度提升 10 倍,已服务 50 多家客户。
企业服务智能体
Runway与Lionsgate扩大战略合作
全球内容巨头 Lionsgate 与 Runway 宣布扩大战略合作,Lionsgate 已取得 Runway 股权,双方将启动联合开发项目共创 IP,首推一部基于现有 IP 和 Runway 生成模型的短剧系列。这是好莱坞首次有片厂以股权绑定 AI 公司。
视频生成影视
Google DeepMind 宣布投入 1000 万美元资助多智能体AI安全研究
Google DeepMind 与合作伙伴共同发起一项 1000 万美元的资金征集,专门用于多智能体 AI 安全方向的研究。此举标志着行业巨头对 Agent 系统潜在风险的高度关注,将推动该领域从理论探讨走向系统性研究。
安全智能体
Anthropic CEO 阿莫迪:AI 可能会造成大规模、长期性的岗位流失
Anthropic CEO 达里奥・阿莫迪警告称,AI 造成的大规模岗位流失是技术固有属性,失业将成为结构性必然结果。他提出完善劳动力市场监测、推行薪资保障与培训补贴,甚至在人力需求永久下降时通过征税推行全民基本收入等具体预案。
大佬观点政策
AI浪潮引发中国担忧:官媒呼吁保护劳动者权益
中国工作场所快速采用人工智能,引发官媒异常直白地呼吁保护劳工权利。报道指出,北京正在考虑如何控制这项新技术带来的风险,反映了决策层对 AI 冲击就业的深层焦虑。
政策监管
🔧 开源与社区
从0到1速通WorkBuddy:国内通用Agent产品教程
WorkBuddy 作为面向国内用户的通用 Agent 产品,支持 Windows 和 Mac,提供免费版和 58 元/月个人专业版。其集成腾讯混元、DeepSeek 等国产大模型,拥有 Skills 市场和 MCP 连接器生态,可打通 QQ 邮箱、腾讯会议等服务,大幅降低了国内用户使用 Agent 的门槛。
MCP教程
🎓 研究与安全
全自主无人机首次击毙了人类士兵
据《新科学家》报道,这是有记录以来第一次由完全自主运行的无人机执行致命攻击,标志着自主武器系统在实战中的新进展。该事件将自主武器的伦理和法律真空问题推到台前,引发各国政策制定者的紧迫关注。
安全伦理
研究模拟显示:LLM 在 95% 的模拟中会使用战术核武器
一项模拟研究显示,大型语言模型在 95% 的模拟战争场景中会选择使用战术核武器。该研究未指明具体模型名称,但结果直观地展示了自主决策系统在军事冲突中的潜在危险性。
安全对齐
Bebop:通过带拒绝采样的多token预测加速RL训练
Bebop 系统研究了多 token 预测(MTP)在 RL 后训练中的加速瓶颈,提出端到端 TV 损失直接优化多步拒绝采样接受率,带来约 10% 提升,最高达 95% 接受率。在 Qwen3.5 等模型上,异步 RL 训练实现 1.8 倍端到端加速。
论文强化学习
📝 编辑点评
今天的 AI 日报呈现出一种强烈的“冰火两重天”态势。一方面,全自主无人机首次实战杀人和 LLM 模拟中高达 95% 的核武器使用率,将 AI 安全的紧迫性从实验室推向了真实战场,这不再是科幻小说,而是各国政策制定者必须连夜面对的残酷现实。另一方面,技术落地的步伐并未放缓,腾讯混元、小米 MiMo Code 等开源项目正在将最前沿的推理优化和编程能力直接交付给开发者,Anthropic 与 DXC 的合作则标志着大模型真正开始渗透到银行、航空等关键行业的核心系统。资本层面,Prometheus 的千亿美元豪赌揭示了一个残酷的真理:在物理世界中,数据不再是互联网上的免费午餐,而是需要真金白银收购工厂才能获得的战略资产。最后,阿莫迪关于“结构性失业”的警告与国内官媒对劳动者权益的罕见呼吁,共同指向了一个核心议题:当 AI 的生产力红利开始兑现,社会分配机制和治理框架的变革已经刻不容缓。
安卿辰博客







