每日 AI 资讯速递
今日 AI 行业呈现“算力军备竞赛”与“应用安全警钟”并存的态势。Anthropic 连发多弹:推出企业级 Claude apps gateway、登陆 Microsoft Foundry,同时其算力支出已飙升至工程师薪酬的 2.3 倍,引发行业对成本效益的深度思考。美团的 1.6 万亿参数国产 ASIC 训练模型 Owl Alpha 登顶 OpenRouter,标志着中国 AI 在算力自主化上的重大突破。与此同时,美军 AI 误炸事件与 Claude Code 安全漏洞曝光,为行业高速发展敲响警钟。
🤖 大模型与基础设施
Anthropic 推出 Claude apps gateway,打通 Bedrock 与 Google Cloud 企业部署
Anthropic 发布自托管控制平面 Claude apps gateway,企业可在 Amazon Bedrock 和 Google Cloud 上运行 Claude Code。该方案作为无状态容器部署于 Linux,后端使用 PostgreSQL,提供 OIDC 对接 Google Workspace、Entra ID、Okta 等 SSO 登录,并支持集中策略管理、角色权限、故障转移路由及多维度消费上限控制。
企业级混合云
美团 LongCat Owl Alpha:1.6 万亿 MoE 模型登顶 OpenRouter,完全基于国产 ASIC 训练
美团的 1.6 万亿参数 MoE 模型 Owl Alpha 成为 OpenRouter 上最流行模型,累计消耗 10 万亿 tokens,性能达 Gemini/Opus 4.6 级别。该模型使用 35 万亿 tokens 训练,完全在 5 万块国产 ASIC 上完成,上线后每日调用量全球 Top 3,在 Hermes Agent 排名第一。该模型即将退役,后续版本待公布。
国产算力MoE
Qwen 3.6 27B 发布:256k 上下文,本地部署的理想选择
Qwen 3.6 27B 是一款密集参数本地大语言模型,原生支持 256k 上下文。在 Macbook Max M5 上运行 llama.cpp Q8_0 量化版可达 30 tokens/s,RTX 5090 上 Q6_K 量化可达 50 tokens/s。用户反馈其可通过单个提示完成创意诗歌、生成六边形扫雷游戏等任务,被认为是首个具备通用智能的本地模型。
本地部署长上下文
Claude 模型在 Microsoft Foundry 正式可用,运行于 NVIDIA GB300 GPU
从今日起,Claude Opus 4.8 和 Claude Haiku 4.5 在 Microsoft Foundry 上正式可用,托管于 Azure 环境,运行在 NVIDIA GB300 GPU 上。用户可通过 Messages API 调用,支持提示缓存和扩展思考,并可选美国数据区域进行推理处理。Azure 用户可使用现有身份验证与统一账单,Enterprise Agreement 客户可享受优惠。
云部署Azure
📱 产品发布与更新
OpenClaw 发布原生 iOS 与 Android 应用
OpenClaw 正式推出原生移动应用,支持 iOS 和 Android 平台。用户可通过手机管理智能体,处理频道、任务和回复,将 AI 智能体装进口袋随身携带。
移动端智能体
Cursor for iOS 公测版发布:手机上运行云端智能体
Cursor 推出 iOS 原生公测版,所有付费计划可用。开发者可在手机上启动始终在线的云端智能体,或远程操控电脑端智能体,支持语音输入、斜杠命令和前沿模型选择。锁屏 Live Activities 和推送通知实时更新状态,云端智能体在隔离虚拟机中运行,可自动生成合并就绪的 PR 并输出演示和日志。
移动开发云端智能体
Herdr:驻留在终端中的 AI 智能体多路复用器
Herdr 是一个开源终端工具,允许用户在单一终端界面内管理和切换多个 AI 智能体会话,为开发者提供更高效的命令行 AI 交互体验。
开源终端工具
💼 行业动态与投资
三星和 SK 海力士计划投资 5900 亿美元扩产芯片,AI 需求推高内存价格
在韩国政府支持下,三星和 SK 海力士计划投入 5900 亿美元扩大芯片产能,包括新建四座工厂和封装中心。Jefferies 预测,2026 年 Q3 内存价格将上涨 40%-50%,2027 年继续上涨 40%-45%。两家公司控制全球近 80% 的高带宽内存芯片市场,内存涨价已推高苹果 Mac 和 MacBook 售价。
芯片制造内存涨价
SK 集团会长崔泰源:到 2035 年建设 15GW AI 数据中心,总投资 1000 万亿韩元
SK 集团宣布计划到 2035 年建成 15GW AI 数据中心容量,项目总投资 1000 万亿韩元(约 4.4 万亿元人民币)。SK 海力士还将向韩国西南部投资 400 万亿韩元,半导体供应项目总投资达 1100 万亿韩元,旨在实现从出口传统商品向智能服务的转变。
数据中心韩国
Anthropic:当 AI 成本超过工程师薪酬
Anthropic 在算力上的支出达到每位工程师每年 51.5 万美元,是其完全薪资(22.4 万美元)的 2.3 倍。相比之下,顶尖 1% 软件公司的算力支出为 8.9 万美元,中位数仅为 1.37 万美元。报告预测了三个 2029 年情景下这一差距的缩小路径。
算力成本行业分析
OpenAI 报告:绘制欧洲 AI 劳动力机遇版图
OpenAI 发布新报告,分析 AI 对欧盟就业的影响,划定哪些职业面临自动化、增长或工作流程变化,为欧洲 AI 劳动力转型提供数据支持。
就业影响欧盟
🏛️ 政策法规
国务院印发《教育发展"十五五"规划》,推进人工智能全学段教育
国务院日前印发规划,要求推进人工智能全学段教育,提升学生 AI 素养及解决问题能力。规划明确完善科学教育体系,强化科技教育与人文教育协同,加强青少年科学素养和创新能力培养,目标到 2030 年高质量教育体系基本建成。
教育政策AI 素养
⚡ 安全与伦理
美军用 AI 选目标误炸伊朗学校,Anthropic Claude 嵌入 Palantir 系统首日建议约 1000 目标
美军在打击伊朗时首次大规模使用 AI 选择目标,Anthropic 的 Claude 模型嵌入 Palantir Maven Smart System 首日建议约 1000 个目标,但对一所学校的导弹袭击导致约 120 名儿童死亡。调查发现关键情报因数据系统未连接而未被传递,五角大楼事后宣布推出 agentic AI initiative。
军事AI伦理
Claude Code 安全漏洞:打开 GitHub 仓库即执行隐藏恶意代码
安全研究人员在 Mozilla 的 GenAI 漏洞赏金平台 0DIN 发现新攻击向量。一个看似正常的 GitHub 仓库包含 setup 脚本,运行时从 DNS 条目拉取命令并执行,恶意代码从未存在于仓库中。Claude Code 在设置过程中遇到错误后自动运行该脚本,打开反向 shell,攻击者可窃取 API 密钥和登录凭据。
安全漏洞AI 编码
🎓 学术研究与开源
Meta 发布 Brain2Qwerty v2:非侵入式实时句子解码
Meta 公布 Brain2Qwerty v2,基于当天发表在《Nature》的 v1,这是非侵入式脑电信号解码的最新里程碑。v2 能从原始脑信号实时解码句子,从字符级性能提升至解码单词和语义,有望帮助数百万因脑损伤或疾病无法沟通的人群。
脑机接口Nature
小红书 RedKnot 推理引擎:将 KV Cache 按注意力头拆解实现长文本加速
RedKnot 将 KV Cache 沿注意力头维度拆解,通过头分类稀疏(局部头占 83.4%-96.8%)、稀疏 FFN 和 SegPagedAttention 三个机制统一算法与存储粒度。在 8 卡 H800 上,TTFT 最高加速 1.6-3.54×,单卡并发提升 4.7-7.8×,预填充 FLOPs 削减 67%-79.5%,精度通常不低于稠密 F1 的 95%。
推理加速KV Cache
EverOS:开源 Markdown 优先智能体记忆运行时,支持混合检索与自进化技能
EverMind 推出开源智能体记忆运行时 EverOS(Apache 2.0 许可),以可编辑的 Markdown 文件为记忆主体,经 SQLite 管理状态、LanceDB 实现混合检索。每个完成的任务记录为 Case,离线提炼为可复用的 Skill,使记忆随使用自我进化。v1.1.0 新增 Knowledge APIs 和跨会话 Reflection 功能。
开源智能体记忆
Anthropic 工程师分享提示词工程实战:评估是唯一严谨方式
Anthropic 应用 AI 工程师 Margot Van Laar 分享提示词工程实战,核心观点:大部分时间在调试和维护已有生产提示词。她强调评估(Eval)是唯一严谨方式,没有评估就是碰运气。两个场景案例展示了使用 XML 标签结构化清理和拆分成生成-评估-修复三个简单提示词的实践。
提示词工程最佳实践
分享两个 Vibe Coding 必备的实用 Prompt:第一性原理与对抗式审查
作者分享 Vibe Coding 中两个关键 Prompt:一是“从第一性原理出发”,强制 AI 从基本事实重新推导本质;二是“对抗式审查”,让 AI 站在恶意用户角度攻防式审查代码。两个 Prompt 形成生成与验证闭环,使纯 Vibe Coding 项目 AIHOT 最近一周请求量超千万次。
Vibe CodingPrompt
📝 编辑点评
今日行业呈现出明显的“三极分化”态势:算力军备竞赛、应用安全觉醒、以及开源生态的务实进化。Anthropic 的算力成本数据揭示了 AI 行业一个残酷的现实——模型能力的提升正在以远超人力成本的速度消耗资本,这迫使企业必须重新审视“AI 投入产出比”的底层逻辑。美团 Owl Alpha 的国产 ASIC 训练成功,则为中国 AI 产业证明了另一条道路:在算力封锁背景下,通过算法创新和工程优化,同样可以达到世界级水平。然而,美军 AI 误炸事件和 Claude Code 安全漏洞的曝光,再次提醒我们:AI 的能力越强,其安全护栏和伦理边界就越不能成为事后补救的选项。建议从业者在追求模型性能的同时,将安全评估和伦理审查纳入产品开发的核心流程。
安卿辰博客







