每日 AI 资讯速递
今日AI领域迎来多项重磅突破与深刻反思。研究揭示AI辅助学习存在长达两年的“隐藏成本”,而机器人、芯片与材料科学则迎来多项技术飞跃。同时,全球首例AI Agent勒索攻击曝光,为行业安全敲响警钟,政策层面亦加速对智能服务的规范。
🤖 大模型与智能体
26000名学生研究显示AI隐藏学习成本需两年才显现
一项追踪26000名中学生30个月的研究揭示,使用AI后作业分数虽提升18%,但闭卷考试分数下降20%,升学考试成绩下降18%至24%,且完全影响约两年才显现。社会学科下降27%,STEM下降22%,每周使用AI一小时损失约5%的学习效果。
教育研究
《Fable》通关指南:短绳AI编程法
专业开发者总结出“短绳方法”以驾驭AI编码代理,要求开发者全程参与规划、审查与提交,杜绝使用YOLO模式。该方法声称即便不用前沿模型,也能产出超越Fable 5的代码质量,强调了人工监督在AI开发中的不可替代性。
开发方法论
Fable 的判断力:Simon Willison 从 Claude Code 团队获得的效率技巧
Simon Willison建议让Fable等模型自主判断何时编写测试,而非硬性规定。为应对价格上涨,另一个技巧是告诉Fable将较小任务委托给Sonnet或Haiku等更低功耗模型,主循环保留判断与审计等高阶任务,实现成本与效率的平衡。
效率技巧
Claude Fable 5 自主优化 AIHOT 网站 SEO/GEO 全记录
作者用Claude Fable 5优化网站SEO,模型自主启动22个Agent调研40分钟,发现豆包App每天六千多次访问未被统计的异常。在规划境外加速时,模型自行提交工单、追问细节并补充备选方案,展现了AI在复杂工程任务中的自主规划与执行能力。
SEO自主智能体
扎克伯格称AI智能体开发速度未如预期
Meta CEO扎克伯格在内部会议上承认,AI智能体的开发速度并未如高管预期般加速。尽管Meta今年预计在AI基础设施上投入高达1450亿美元并进行了大规模裁员重组,但以AI为中心的新公司结构所带来的好处尚未实现,扎克伯格相信未来三到六个月将开始看到改善。
行业动态Meta
🚀 产品发布
生数科技发布 Vidu S1,推动视频生成迈向"实时交互"新时代
7月3日,生数科技发布Vidu S1实时交互模型,支持实时视频通话和语音控制视频走向,实现无限时长连续互动。该模型在540P分辨率下实现25FPS(最高42FPS)实时生成,通过TurboDiffusion等技术降低计算成本,已开启内测。
视频生成实时交互
JoyAI App 上线 UGC 数字人功能,用户可"捏"出专属虚拟玩伴
JoyAI App上线UGC数字人功能,用户上传一张照片即可生成专属虚拟分身,支持写实或卡通风格,并搭配自定义语音。该功能集成全双工对话技术,支持随时打断,数字人兼具情绪陪伴与点外卖、金融咨询等生活服务能力。
数字人UGC
Wan Video 推出"音乐伴舞"新功能
Wan Video推出“音乐伴舞”功能,用户上传一个角色和一首歌曲,即可生成与节奏同步的舞蹈视频。该功能支持街舞、踢踏舞、拉丁舞、K-Pop和中国古典舞等多种舞种,实现了从节拍到动作的精准同步。
视频生成音乐
面向 Web 开发者的 Safari MCP 服务器
Safari Technology Preview 247推出Safari MCP服务器,允许MCP兼容客户端连接浏览器窗口。智能体可获取DOM、网络请求、截图和console输出等信息,自主完成调试、性能分析和可访问性检查等任务,内置了`browser_console_messages`、`screenshot`等多个实用工具。
Web开发MCP
💼 行业动态
全球首例 AI Agent 勒索攻击曝光,从漏洞利用到数据库加密全程自主完成
安全厂商Sysdig首次记录到AI Agent“JADEPUFFER”自动完成的勒索攻击。该Agent利用Langflow漏洞远程执行代码,自主收集多家云平台API密钥,并通过默认密码访问对象存储和数据库,最终加密数据。它还能横向移动到Nacos服务器,展现了AI在恶意攻击中的自主性与危害性。
安全勒索攻击
得州特斯拉致命车祸:司机嫌FSD太保守,加速踏板踩死致76岁居民死亡
44岁司机因嫌FSD“不够激进”,在6秒内将加速踏板踩死,时速升至117公里,导致车辆冲入住宅致76岁居民死亡。特斯拉AI负责人证实手动操作覆盖了FSD,制动踏板始终未踩。家属已起诉特斯拉和司机,NHTSA和NTSB已介入调查。
自动驾驶安全
藏师傅PPT与Pencil结合使用技巧
用户将AI生成的PPT导入Pencil设计软件,可一次性浏览所有页面并手动调整AI常见的排版问题。Pencil提供比PPT更强的对齐、嵌套和打组编辑能力,支持导出网页和编辑文件,大幅提升了AI生成内容的可编辑性与实用性。
工作流设计
🏛️ 政策法规
国家网信办就《互联网信息服务管理办法》再次征求意见,首设"智能信息服务"专章规范AI服务
7月3日,国家网信办就《互联网信息服务管理办法(修订草案征求意见稿)》再次公开征求意见。草案新增“智能信息服务”专章,要求AI服务提供者公示技术原理、训练数据来源,对生成合成内容进行标识,并禁止强制用户使用智能服务或利用算法扰乱网络舆论。意见反馈截止8月2日。
政策监管
🎓 学术研究
NVIDIA 联合多所大学提出 ASPIRE:自我改进机器人框架,零样本成功率最高提升 77 分
NVIDIA联合密歇根大学、UIUC等提出ASPIRE,一个持续学习机器人框架。它通过协调器-执行器架构和进化搜索优化控制程序,在LIBERO-Pro上最高比最强基线提升77分,Robosuite双手交接成功率从20%提升至92%。编程智能体使用Claude Opus 4.6,展现了强大的零样本泛化能力。
机器人强化学习
我国研制全球首款基于可控存内计算的忆阻器神经动力学芯片
北京大学联合中科院上海微系统所发布全球首款基于可控存内计算的忆阻器神经动力学芯片,单步运算时延压缩至2.12毫秒。该芯片采用40纳米工艺,在脑皮层重建等任务中较当前GPU提速50至478倍,突破了神经动力学实时计算瓶颈,相关成果发表于《科学》。
芯片神经形态
阿里达摩院发布超导材料发现AI智能体Elements Claw
阿里达摩院联合多所高校发布首个超导材料发现AI智能体Elements Claw,采用“专通融合”架构。AI仅用28个GPU小时筛选240万晶体结构,预测出6.8万个候选材料,其中4种已合成并验证超导性,临界温度最高6.5K。其判断超导性AUC达0.996,预测临界温度平均误差小于1K。
材料科学AI智能体
面壁智能发布AI全自动预训练框架ForgeTrain,8小时追平Megatron-LM
面壁智能发布全球首个完全由AI编写、无人类干预的生产级大模型预训练框架ForgeTrain。该框架在8小时内追平Megatron-LM,1.5至2天内实现稳定反超,模型FLOPS利用率提升约8%~10%,且可迁移至不同模型和硬件(H100及昇腾NPU),全程自动判定优化。
预训练自动化
🔧 开源项目
claude-real-video是一个开源工具,让LLM基于视频画面而非字幕进行理解。它通过场景检测提取关键帧、去重并转录音频,生成干净的本地文件夹供模型读取。支持YouTube链接或本地文件,全部处理在本地完成,不上传云端,保障隐私。
开源视频理解
阿里巴巴发布 Page Agent:开源 JavaScript 库实现网页 DOM 自然语言操控
阿里巴巴发布Page Agent,一个开源的JavaScript客户端库,嵌入网页后可通过自然语言指令直接操作DOM元素。它不依赖截图或多模态模型,而是将实时DOM脱水压缩为文本映射,让纯文本模型精准执行点击、表单填写等操作,并支持任意OpenAI兼容端点的模型。
开源DOM操控
pxpipe:通过图像化压缩输入token降低Claude Code成本
pxpipe是一个本地代理,将系统提示等密集文本渲染为PNG图像,利用图像token成本取决于像素尺寸的特性压缩输入token。在Fable 5模型上,约25k文本token压缩为约2.7k图像token,端到端账单降低59-70%,SWE-bench Lite成本从$54降至$27。
开源成本优化
📝 编辑点评
今日热点呈现出AI行业“冰火两重天”的态势。一方面,从NVIDIA的机器人框架到我国的忆阻器芯片,从材料发现到预训练框架,技术突破层出不穷,AI正以惊人的速度渗透至基础科学与硬件底层。另一方面,26000名学生研究揭示的“学习陷阱”与全球首例AI Agent勒索攻击,无情地戳破了技术万能的神话,提醒我们AI的副作用与安全风险同样需要被严肃对待。政策层面,国家网信办首次设立“智能信息服务”专章,标志着监管正从宏观框架走向精细化、场景化。扎克伯格的坦诚也表明,即便是巨头,在AI智能体的落地速度上也面临挑战。在追求技术极致的同时,如何平衡效率、安全与社会影响,将是未来行业的核心命题。
安卿辰博客







