每日 AI 资讯速递
今日AI行业呈现多线并进态势:OpenAI在IPO前夕招兵买马并提升GPT-5.5 Instant健康问答能力,Anthropic的Claude Opus 4.7在机器人实验中实现自主完成任务,速度比人类团队快约20倍。政策层面,美国为AI数据中心开辟电网快车道,我国首部L3/L4自动驾驶强制性国标公示,八部门发文支持AI产品消费。此外,AI安全与隐私问题持续引发关注,MosaicLeaks研究揭示了深度研究智能体的隐私泄露风险。
🤖 大模型
OpenAI IPO前连下两城:招揽Transformer共同作者及前白宫AI政策官员
OpenAI在IPO前夕连招两位重量级人物:Google DeepMind AI先驱、Transformer架构共同作者Noam Shazeer,以及前特朗普白宫AI政策官员Dean Ball。Shazeer此前通过27亿美元收购协议重返Google,此次离职加盟OpenAI。Ball将于7月6日加入,领导新组建的Strategic Futures团队,向首席战略官Jason Kwon汇报,团队将负责前沿AI政策与内部治理,聚焦灾难性风险、递归自我改进、劳动力市场影响及前沿实验室与政府关系等议题。
人才引进IPO政策
GPT-5.5 Instant健康问答能力追平前沿Thinking模型
OpenAI与全球60个国家、49种语言、26个专科的数百名医生合作,通过医生主导的评估大幅提升了GPT-5.5 Instant在健康相关问题的智能水平,现已能与公司前沿Thinking模型相当。该模型每周为超过2.3亿ChatGPT用户服务,近两个月生产流量显示健康类回复事实性问题率下降71%。由于面向所有免费用户开放,这些改进可惠及更多人。
医疗GPT-5.5性能提升
OpenAI强化学习实现广泛且持久的有益模型
OpenAI通过强化学习在真实对话场景中训练模型,使其展现诚实、认知谦逊、元认知透明、可纠正性、普遍公平性和对人类福祉的关心等有益特质。训练后模型在数十项独立对齐评测上均表现提升,且这种改善泛化到未参与训练的领域、任务和评分设定。在对抗性提示或微调下,模型仍难以被导向有害行为,表明有益特质强化学习可产生广泛且持久的对齐泛化。
AI安全对齐强化学习
Grok TTS盲测人类感得分96登顶
xAI的Grok TTS模型在@Vapi_AI的Humanness Index盲测中以96分(真人100分)位居榜首。该指数选取同一声音和引文,经各模型克隆后由听众盲评,表明Grok TTS在语音合成自然度上已达到极高水平。
语音合成TTS盲测
🚀 产品发布
Claude Code现已支持artifacts
从今日起,Claude Code可将工作进度生成为artifacts——实时、可分享的交互式网页,涵盖PR走查、系统说明、仪表盘、发布清单等。artifacts基于会话完整上下文自动构建,更新时页面原地刷新,同事即时可见。默认仅作者可见,可分享给组织内成员,由管理员通过组织层级开关和角色权限管控。内部测试中最常见用例为调试:工程师调查事件,Claude Code分析日志并发布包含时间线、嫌疑提交和错误率图表的artifact。
Claude Code协作开发工具
驾驭Claude Code:CLAUDE.md、技能、钩子、规则、子智能体等
Claude Code提供七种自定义指令方式:CLAUDE.md(根目录始终加载,子目录按需加载)、规则(无范围或路径范围)、技能(按需调用,共享token预算)、子智能体(隔离上下文运行并返回最终消息)、钩子(生命周期事件触发,绕过压缩)、输出样式(注入系统提示,永不压缩)和附加系统提示(CLI标志,仅单次有效)。每种方式在加载时机、压缩行为、上下文成本和适用场景上各有不同,例如CLAUDE.md适合存放构建命令与编码规范,路径范围规则避免无关上下文消耗,子智能体用于并行隔离任务。
Claude Code自定义开发效率
Claude Enterprise推出企业托管MCP连接器授权管理
Claude Enterprise推出企业托管授权功能,管理员可通过身份提供商(率先支持Okta)为整个组织配置MCP连接器。用户首次登录Claude时自动获得授权,无需手动操作,实现零接触设置。该功能基于Model Context Protocol的Enterprise-Managed Authorization扩展构建,支持Asana、Atlassian、Canva、Figma、Granola、Linear、Supabase等MCP提供商,Slack即将支持。
企业服务MCP授权管理
企业版新用量分析与更新的支出控制
OpenAI为ChatGPT Enterprise推出信用额度用量分析与更新的支出控制功能。全局管理控制台统一展示ChatGPT和Codex的信用消耗,支持按时间、用户、产品、模型追踪用量趋势。管理员可为整个工作区设置默认限额,按群组配置额度,并为个人设置叠加限制。员工可查看个人用量并申请增加额度,这些功能即日起可用。
企业服务用量分析支出控制
火山引擎上线豆包实时语音模型3.0 API服务,开启邀测
火山引擎上线豆包实时语音模型3.0(Seeduplex)API服务并开启邀测。该模型为原生全双工端到端语音大模型,具备精准遵循、抗干扰、动态判停三大优势。可在多人对话中安静待命,指定话题出现时主动加入;抗干扰力提升,误回复率与误打断率大幅降低;判停延迟缩短约250ms,复杂场景抢话比例下降40%,用户主动打断延迟缩短约300ms。适用于汽车智能座舱、智能硬件、智能客服等场景。
语音模型API端到端
Kimi Work新增目标模式与插件中心,6月推出额度消耗5折福利
月之暗面旗下Kimi Work(Beta版)新增「目标模式」,支持设定终点后由Agent自主循环推进任务,最长连续运行24小时,过程中人类可随时中断调整。同时上线「插件中心」,可选装百度网盘、Canva可画、钉钉、飞书、WPS、Notion、Cloudflare等外部应用。6月限时福利期间,Kimi电脑客户端Work模式所有任务会员额度消耗减半,即从0.02%降至0.01%。
Agent插件Kimi
Adobe为Photoshop、Premiere等多款Creative Cloud应用加入AI智能体
Adobe将其"创意智能体"扩展至Photoshop、Premiere等应用,以公开测试形式提供AI Assistant。该智能体可自动完成多步骤常规任务,如Premiere分拣素材和粗剪、Photoshop换背景、Illustrator批量生成文件、InDesign更新版式等。Firefly新增面向个人创作者的品牌套件、产品图转短视频及Quick Cut自动剪辑功能。Adobe工具已集成至ChatGPT、Claude及Microsoft 365 Copilot。
创意工具AI智能体Adobe
💼 行业动态
Project Fetch第二阶段:Claude Opus 4.7自主完成任务,速度比人类团队快约20倍
Anthropic发布Project Fetch实验第二阶段结果。在2024年8月原始实验中,配备Claude Opus 4.1的人类团队在操控四足机器人时显著超越无AI团队。新实验中,Claude Opus 4.7无需人类协助即完成所有任务,速度比最快人类团队快约20倍,比无Claude团队快37倍以上,编码量减少近10倍。模型在传感器连接、路径规划等环节表现出色,但在精确移动沙滩球等闭环控制任务上仍存在困难。这些进展源于通用模型规模化,而非针对机器人领域的专项优化。
机器人自主任务Claude Opus
ChatGPT图像生成器可被绕过滤镜生成暴力和色情内容
Mindgard红队研究发现,ChatGPT的图像生成器可通过简单提示词轻易绕过内容过滤器,在未直接请求的情况下自动生成性暴力、血腥谋杀等露骨图像。一个热门的"恢复照片"提示词因输入模糊而绕过输入过滤器,结果如同俄罗斯轮盘赌;进一步添加虚假图像ID和"不做审查"指令后,模型持续生成高度性化女性图像,甚至出现被捆绑殴打的尸体。研究指出,OpenAI此前声称修复的裸体问题仍未解决,暴露了AI工具广泛可及性与不足内容过滤的现实风险。
AI安全内容过滤红队测试
皮尤民调:63%美国人认为AI发展太快,ChatGPT使用率翻番
皮尤研究中心最新民调显示,63%美国人认为AI发展速度过快。ChatGPT使用率较2023年翻番,44%受访者曾使用。49%偶尔使用聊天机器人,仅16%认为AI会有积极社会影响。青年群体使用率更高但更悲观:18-29岁中66%用过,48%认为有负面影响,仅14%看好。30-49岁中34%每天至少使用一次。约四成用AI处理工作,30%认为提高效率,28%认为帮助获取信息。此外,66%成年人担心AI传播错误信息。
民调社会影响ChatGPT
🏛️ 政策法规
AI数据中心获政府强制电网快车道
美国联邦能源监管委员会(FERC)命令六大电网运营商为数据中心等大型用户提供快速并网通道,数据中心需承担并网费用。FERC同时要求运营商考虑"替代输电技术",并在30天内报告剩余发电容量、60天内审查本区域电价。指令并未解决发电容量短缺问题。数据中心电力需求预计到2035年增长近三倍,而电网运营商此前长期应对近乎零的需求增长。据Bloomberg,部分地区批发电价较五年前上涨了267%。
能源数据中心政策
伯尼·桑德斯提出7万亿美元AI计划:对大型AI公司征收50%股票税
伯尼·桑德斯提出立法,对年AI销售额超2亿美元的公司征收50%股票税,建立价值约7万亿美元的主权财富基金。基金每年向每位美国公民发放超1000美元股息(5%年股息),并资助医疗、教育、住房。同时成立由总统提名、参议院确认的两党"民主AI独立委员会",通过投票权阻止公司损害公共利益。法案还要求AI公司剥离非AI业务。该计划面临共和党国会和特朗普政府阻力。
税收主权财富基金立法
我国首部L3/L4自动驾驶强制性国标公示:2027年7月起实施
工信部6月16日就《智能网联汽车自动驾驶系统安全要求》等2项强制性国标公开征求意见,公示至6月24日,建议2027年7月1日起实施。该标准系我国首部针对L3/L4的强制性国标,要求系统安全水平至少达到"合格且专注驾驶人",引入Safety Case机制。L3重点规范人机交接,L4强调自身风险处置、不得依赖远程协助。新申请车型实施日起执行,已获批车型有约一年过渡期。
自动驾驶国家标准L3/L4
八部门:用好个人消费贷款财政贴息政策,支持消费者购买AI相关产品
商务部等八部门6月18日发布关于加快"人工智能+消费"发展的实施意见。其中提到加大财政资金支持,落实数码和智能产品购新政策,鼓励地方在消费品以旧换新框架内自主制定补贴,重点支持新一代智能终端消费。增加AI手机、智能电脑、智能电视、智能家居、AI眼镜、智能网联汽车、人形机器人等产品供给,培育智能穿戴消费市场。同时加快AI在居家服务、养老服务、文化旅游、住宿餐饮、教育教学等领域的应用,建设AI商品首发平台,举办"人工智能进万家"活动。
消费政策AI+消费财政补贴
🎓 学术研究
MosaicLeaks:你的研究智能体能保守秘密吗?
深度研究智能体在结合私有本地文档与外部网页检索时存在隐私泄露风险。MosaicLeaks提出包含1,001条多跳研究链的新任务,每条链交错混合本地与公共子问题。测试发现智能体频繁泄露私有信息,单纯优化任务性能反而加剧泄露。基于此,研究提出隐私感知深度研究(PA-DR)强化学习训练方法,将严格链成功率从48.7%提升至58.7%,同时将答案/全面信息泄露率从34.0%降至9.9%。
隐私智能体安全
📝 编辑点评
今日AI行业呈现出几个鲜明趋势:首先是AI安全与治理议题的全面升温。从OpenAI的有益强化学习研究到MosaicLeaks揭示的隐私泄露风险,再到ChatGPT图像生成器的安全漏洞,行业正在从"追求性能"转向"负责任部署"的新阶段。其次是政策层面的加速介入——中美两国几乎同步出台AI相关法规,美国为数据中心开辟电网快车道,中国推出L3/L4自动驾驶国标和AI消费刺激政策,表明各国政府正从旁观者变为深度参与者。第三是Agent能力的质变:Claude Opus 4.7在机器人任务中实现完全自主,速度超越人类团队20倍;Kimi Work和Adobe分别推出目标模式和创意智能体,Agent正从"辅助工具"进化为"自主执行者"。值得注意的是,皮尤民调显示公众对AI发展的担忧并未因使用率提升而缓解,这提示行业在追求技术突破的同时,必须更主动地回应社会关切。最后,OpenAI的IPO前夕人才布局和桑德斯的激进税收提案,折射出AI行业在商业价值与公共利益之间的张力,这一矛盾将在未来数年持续影响行业发展方向。
安卿辰博客







