AI 日报

每日 AI 资讯速递

2026年06月30日星期二

今日 AI 行业呈现“算力军备竞赛”与“应用安全警钟”并存的态势。Anthropic 连发多弹：推出企业级 Claude apps gateway、登陆 Microsoft Foundry，同时其算力支出已飙升至工程师薪酬的 2.3 倍，引发行业对成本效益的深度思考。美团的 1.6 万亿参数国产 ASIC 训练模型 Owl Alpha 登顶 OpenRouter，标志着中国 AI 在算力自主化上的重大突破。与此同时，美军 AI 误炸事件与 Claude Code 安全漏洞曝光，为行业高速发展敲响警钟。

🤖 大模型与基础设施

Anthropic 推出 Claude apps gateway，打通 Bedrock 与 Google Cloud 企业部署

Anthropic 发布自托管控制平面 Claude apps gateway，企业可在 Amazon Bedrock 和 Google Cloud 上运行 Claude Code。该方案作为无状态容器部署于 Linux，后端使用 PostgreSQL，提供 OIDC 对接 Google Workspace、Entra ID、Okta 等 SSO 登录，并支持集中策略管理、角色权限、故障转移路由及多维度消费上限控制。

📰 Anthropic
企业级混合云

美团 LongCat Owl Alpha：1.6 万亿 MoE 模型登顶 OpenRouter，完全基于国产 ASIC 训练

美团的 1.6 万亿参数 MoE 模型 Owl Alpha 成为 OpenRouter 上最流行模型，累计消耗 10 万亿 tokens，性能达 Gemini/Opus 4.6 级别。该模型使用 35 万亿 tokens 训练，完全在 5 万块国产 ASIC 上完成，上线后每日调用量全球 Top 3，在 Hermes Agent 排名第一。该模型即将退役，后续版本待公布。

📰 X/EMostaque
国产算力MoE

Qwen 3.6 27B 发布：256k 上下文，本地部署的理想选择

Qwen 3.6 27B 是一款密集参数本地大语言模型，原生支持 256k 上下文。在 Macbook Max M5 上运行 llama.cpp Q8_0 量化版可达 30 tokens/s，RTX 5090 上 Q6_K 量化可达 50 tokens/s。用户反馈其可通过单个提示完成创意诗歌、生成六边形扫雷游戏等任务，被认为是首个具备通用智能的本地模型。

📰 开源社区
本地部署长上下文

Claude 模型在 Microsoft Foundry 正式可用，运行于 NVIDIA GB300 GPU

从今日起，Claude Opus 4.8 和 Claude Haiku 4.5 在 Microsoft Foundry 上正式可用，托管于 Azure 环境，运行在 NVIDIA GB300 GPU 上。用户可通过 Messages API 调用，支持提示缓存和扩展思考，并可选美国数据区域进行推理处理。Azure 用户可使用现有身份验证与统一账单，Enterprise Agreement 客户可享受优惠。

📰 Anthropic
云部署Azure

📱 产品发布与更新

OpenClaw 发布原生 iOS 与 Android 应用

OpenClaw 正式推出原生移动应用，支持 iOS 和 Android 平台。用户可通过手机管理智能体，处理频道、任务和回复，将 AI 智能体装进口袋随身携带。

📰 OpenClaw
移动端智能体

Cursor for iOS 公测版发布：手机上运行云端智能体

Cursor 推出 iOS 原生公测版，所有付费计划可用。开发者可在手机上启动始终在线的云端智能体，或远程操控电脑端智能体，支持语音输入、斜杠命令和前沿模型选择。锁屏 Live Activities 和推送通知实时更新状态，云端智能体在隔离虚拟机中运行，可自动生成合并就绪的 PR 并输出演示和日志。

📰 Cursor
移动开发云端智能体

Herdr：驻留在终端中的 AI 智能体多路复用器

Herdr 是一个开源终端工具，允许用户在单一终端界面内管理和切换多个 AI 智能体会话，为开发者提供更高效的命令行 AI 交互体验。

📰 GitHub
开源终端工具

💼 行业动态与投资

三星和 SK 海力士计划投资 5900 亿美元扩产芯片，AI 需求推高内存价格

在韩国政府支持下，三星和 SK 海力士计划投入 5900 亿美元扩大芯片产能，包括新建四座工厂和封装中心。Jefferies 预测，2026 年 Q3 内存价格将上涨 40%-50%，2027 年继续上涨 40%-45%。两家公司控制全球近 80% 的高带宽内存芯片市场，内存涨价已推高苹果 Mac 和 MacBook 售价。

📰 行业报告
芯片制造内存涨价

SK 集团会长崔泰源：到 2035 年建设 15GW AI 数据中心，总投资 1000 万亿韩元

SK 集团宣布计划到 2035 年建成 15GW AI 数据中心容量，项目总投资 1000 万亿韩元（约 4.4 万亿元人民币）。SK 海力士还将向韩国西南部投资 400 万亿韩元，半导体供应项目总投资达 1100 万亿韩元，旨在实现从出口传统商品向智能服务的转变。

📰 IT之家
数据中心韩国

Anthropic：当 AI 成本超过工程师薪酬

Anthropic 在算力上的支出达到每位工程师每年 51.5 万美元，是其完全薪资（22.4 万美元）的 2.3 倍。相比之下，顶尖 1% 软件公司的算力支出为 8.9 万美元，中位数仅为 1.37 万美元。报告预测了三个 2029 年情景下这一差距的缩小路径。

📰 Tom Tunguz
算力成本行业分析

OpenAI 报告：绘制欧洲 AI 劳动力机遇版图

OpenAI 发布新报告，分析 AI 对欧盟就业的影响，划定哪些职业面临自动化、增长或工作流程变化，为欧洲 AI 劳动力转型提供数据支持。

📰 OpenAI
就业影响欧盟

🏛️ 政策法规

国务院印发《教育发展"十五五"规划》，推进人工智能全学段教育

国务院日前印发规划，要求推进人工智能全学段教育，提升学生 AI 素养及解决问题能力。规划明确完善科学教育体系，强化科技教育与人文教育协同，加强青少年科学素养和创新能力培养，目标到 2030 年高质量教育体系基本建成。

📰 IT之家
教育政策AI 素养

⚡ 安全与伦理

美军用 AI 选目标误炸伊朗学校，Anthropic Claude 嵌入 Palantir 系统首日建议约 1000 目标

美军在打击伊朗时首次大规模使用 AI 选择目标，Anthropic 的 Claude 模型嵌入 Palantir Maven Smart System 首日建议约 1000 个目标，但对一所学校的导弹袭击导致约 120 名儿童死亡。调查发现关键情报因数据系统未连接而未被传递，五角大楼事后宣布推出 agentic AI initiative。

📰 国际媒体
军事AI伦理

Claude Code 安全漏洞：打开 GitHub 仓库即执行隐藏恶意代码

安全研究人员在 Mozilla 的 GenAI 漏洞赏金平台 0DIN 发现新攻击向量。一个看似正常的 GitHub 仓库包含 setup 脚本，运行时从 DNS 条目拉取命令并执行，恶意代码从未存在于仓库中。Claude Code 在设置过程中遇到错误后自动运行该脚本，打开反向 shell，攻击者可窃取 API 密钥和登录凭据。

📰 0DIN
安全漏洞AI 编码

🎓 学术研究与开源

Meta 发布 Brain2Qwerty v2：非侵入式实时句子解码

Meta 公布 Brain2Qwerty v2，基于当天发表在《Nature》的 v1，这是非侵入式脑电信号解码的最新里程碑。v2 能从原始脑信号实时解码句子，从字符级性能提升至解码单词和语义，有望帮助数百万因脑损伤或疾病无法沟通的人群。

📰 Meta AI
脑机接口Nature

小红书 RedKnot 推理引擎：将 KV Cache 按注意力头拆解实现长文本加速

RedKnot 将 KV Cache 沿注意力头维度拆解，通过头分类稀疏（局部头占 83.4%-96.8%）、稀疏 FFN 和 SegPagedAttention 三个机制统一算法与存储粒度。在 8 卡 H800 上，TTFT 最高加速 1.6-3.54×，单卡并发提升 4.7-7.8×，预填充 FLOPs 削减 67%-79.5%，精度通常不低于稠密 F1 的 95%。

📰 小红书
推理加速KV Cache

EverOS：开源 Markdown 优先智能体记忆运行时，支持混合检索与自进化技能

EverMind 推出开源智能体记忆运行时 EverOS（Apache 2.0 许可），以可编辑的 Markdown 文件为记忆主体，经 SQLite 管理状态、LanceDB 实现混合检索。每个完成的任务记录为 Case，离线提炼为可复用的 Skill，使记忆随使用自我进化。v1.1.0 新增 Knowledge APIs 和跨会话 Reflection 功能。

📰 EverMind
开源智能体记忆

Anthropic 工程师分享提示词工程实战：评估是唯一严谨方式

Anthropic 应用 AI 工程师 Margot Van Laar 分享提示词工程实战，核心观点：大部分时间在调试和维护已有生产提示词。她强调评估（Eval）是唯一严谨方式，没有评估就是碰运气。两个场景案例展示了使用 XML 标签结构化清理和拆分成生成-评估-修复三个简单提示词的实践。

📰 Code with Claude
提示词工程最佳实践

分享两个 Vibe Coding 必备的实用 Prompt：第一性原理与对抗式审查

作者分享 Vibe Coding 中两个关键 Prompt：一是“从第一性原理出发”，强制 AI 从基本事实重新推导本质；二是“对抗式审查”，让 AI 站在恶意用户角度攻防式审查代码。两个 Prompt 形成生成与验证闭环，使纯 Vibe Coding 项目 AIHOT 最近一周请求量超千万次。

📰 微信公众号
Vibe CodingPrompt

📝 编辑点评

今日行业呈现出明显的“三极分化”态势：算力军备竞赛、应用安全觉醒、以及开源生态的务实进化。Anthropic 的算力成本数据揭示了 AI 行业一个残酷的现实——模型能力的提升正在以远超人力成本的速度消耗资本，这迫使企业必须重新审视“AI 投入产出比”的底层逻辑。美团 Owl Alpha 的国产 ASIC 训练成功，则为中国 AI 产业证明了另一条道路：在算力封锁背景下，通过算法创新和工程优化，同样可以达到世界级水平。然而，美军 AI 误炸事件和 Claude Code 安全漏洞的曝光，再次提醒我们：AI 的能力越强，其安全护栏和伦理边界就越不能成为事后补救的选项。建议从业者在追求模型性能的同时，将安全评估和伦理审查纳入产品开发的核心流程。

📊 数据来源：

⚠️ 免责声明：内容整理自公开来源，仅供参考。

AI日报 | 2026年06月30日

每日 AI 资讯速递

🤖 大模型与基础设施

Anthropic 推出 Claude apps gateway，打通 Bedrock 与 Google Cloud 企业部署

美团 LongCat Owl Alpha：1.6 万亿 MoE 模型登顶 OpenRouter，完全基于国产 ASIC 训练

Qwen 3.6 27B 发布：256k 上下文，本地部署的理想选择

Claude 模型在 Microsoft Foundry 正式可用，运行于 NVIDIA GB300 GPU

📱 产品发布与更新

OpenClaw 发布原生 iOS 与 Android 应用

Cursor for iOS 公测版发布：手机上运行云端智能体

Herdr：驻留在终端中的 AI 智能体多路复用器

💼 行业动态与投资

三星和 SK 海力士计划投资 5900 亿美元扩产芯片，AI 需求推高内存价格

SK 集团会长崔泰源：到 2035 年建设 15GW AI 数据中心，总投资 1000 万亿韩元

Anthropic：当 AI 成本超过工程师薪酬

OpenAI 报告：绘制欧洲 AI 劳动力机遇版图

🏛️ 政策法规

国务院印发《教育发展"十五五"规划》，推进人工智能全学段教育

⚡ 安全与伦理

美军用 AI 选目标误炸伊朗学校，Anthropic Claude 嵌入 Palantir 系统首日建议约 1000 目标

Claude Code 安全漏洞：打开 GitHub 仓库即执行隐藏恶意代码

🎓 学术研究与开源

Meta 发布 Brain2Qwerty v2：非侵入式实时句子解码

小红书 RedKnot 推理引擎：将 KV Cache 按注意力头拆解实现长文本加速

EverOS：开源 Markdown 优先智能体记忆运行时，支持混合检索与自进化技能

Anthropic 工程师分享提示词工程实战：评估是唯一严谨方式

分享两个 Vibe Coding 必备的实用 Prompt：第一性原理与对抗式审查

📝 编辑点评

您可以选择一种方式赞助本站

支付宝扫一扫赞助

微信钱包扫描赞助

相关推荐

热门推荐

评论抢沙发

安卿辰博客专业快捷

QUX主题是一款功能强大的收费 WordPress 主题，适配个人博客、资源分享站、资讯网站等多种场景

注册

QQ咨询

关注微信

回顶部

每日 AI 资讯速递

🤖 大模型与基础设施

📱 产品发布与更新

💼 行业动态与投资

🏛️ 政策法规

⚡ 安全与伦理

🎓 学术研究与开源

📝 编辑点评

您可以选择一种方式赞助本站

支付宝扫一扫赞助

微信钱包扫描赞助

微信扫码分享

相关推荐

热门推荐

评论 抢沙发

安卿辰博客 专业 快捷

QUX主题是一款功能强大的收费 WordPress 主题，适配个人博客、资源分享站、资讯网站等多种场景

登录

注册

QQ咨询

关注微信

回顶部

评论抢沙发

安卿辰博客专业快捷