每日 AI 资讯速递
今日AI领域迎来多项重磅发布与战略动态:Anthropic推出性能逼近旗舰的Claude Sonnet 5与专为科研打造的Claude Science工作台;Google DeepMind发布超高速图像模型Nano Banana 2 Lite;美团LongCat凭借1.6T参数的MoE架构杀入编程大模型赛道。与此同时,AI在数学证明、就业市场及基础设施投资层面的影响持续深化,行业正从单一模型竞赛转向工具化、平台化与垂直场景的深度融合。
🤖 大模型
Claude Sonnet 5 发布
Anthropic发布Claude Sonnet 5,性能接近Opus 4.8,在BrowseComp和OSWorld-Verified评测中严格优于前代Sonnet 4.6。定价策略激进,即日起至2026年8月底输入仅$2/百万token,输出$10/百万token,在推理、编程与工具使用等智能体能力上实现大幅跃升。
模型发布智能体
美团 LongCat 发布旗舰模型 LongCat-2.0
美团LongCat推出1.6T参数MoE架构模型,约48B活跃参数,原生支持1M上下文窗口。定价极低:缓存命中仅$0.015/1M tokens,输出$2.95/1M tokens。模型专为Agentic Coding设计,采用LSA稀疏注意力与Zero-Compute Experts技术,实现动态激活且无算力浪费。
MoE编程
Google DeepMind 发布 Nano Banana 2 Lite 和 Gemini Omni Flash
DeepMind推出Nano Banana 2 Lite,文本到图像输出仅需4秒,每1K分辨率图像成本低至$0.034,为系列中速度最快、成本最低的图像模型。同时发布Gemini Omni Flash预览版,两者均已上线Google AI Studio与Gemini API,进一步降低多模态应用门槛。
多模态图像生成
🚀 产品发布
NotebookLM Short Video Overviews 全量上线 Web 英文版
NotebookLM向Web英文用户全量推出短视频概览功能,可将复杂资料自动转化为60秒竖屏视频并深入讲解概念。此前该功能仅限付费订阅者,免费用户即将可用,标志着AI知识管理工具正从文本摘要向原生视频内容生成进化。
视频生成知识管理
Claude Science 科研工作台正式上线
Anthropic推出AI科研工作台Claude Science,提供超60项预配置技能与连接器,覆盖基因组学、单细胞、蛋白质组学等领域。支持在macOS/Linux本地或通过SSH/HPC远程运行,可生成含代码和环境的可审计成果(如3D蛋白质结构),并内置reviewer agent自动检查引用与计算错误,接入NVIDIA BioNeMo的Evo 2、Boltz-2等模型。
科研工作台
Acti 将 AI 智能体直接放入手机键盘
新加坡初创公司Acti发布基于Google Gemini的智能体键盘,用户可用自然语言创建快捷方式(如长按T键翻译消息),早期测试者两周内创建超1000个Skills。该应用采用本地优先架构,默认不访问私人消息,获530万美元种子轮融资,由BITKRAFT Ventures领投。
智能体移动端
Apple Creator Studio 更新:更智能、更快速、更互联
Apple Creator Studio推出多项AI增强更新:Final Cut Pro新增on-device AI驱动的自动字幕生成与剪辑点检测,Mac版加入Auto Mask自动识别主体、增强的Match Color和Advanced Trimming。支持将帧发送至Pixelmator Pro编辑,并在Keynote、Pages、Numbers中直接调用Pixelmator Pro功能。
创意工具端侧AI
Claude Desktop 推出 Linux 公测版
Claude Desktop现已在Ubuntu和Debian上推出测试版,Linux用户可在所有付费计划中获得包括Claude Code、Claude Cowork和聊天在内的一流桌面体验。此举补全了Anthropic在桌面端操作系统覆盖的最后一块拼图。
Linux桌面端
💼 行业动态
黑石未来3~5年拟投300亿美元在日本建AI数据中心
黑石计划未来3~5年在日本AI数据中心领域投资300亿美元,在现有500MW基础上新增超1GW容量。此外,黑石、阿波罗、博通联合成立AI XPV平台,目标2028年向OpenAI、Anthropic等提供超20GW算力,首期350亿美元支持Anthropic部署1GW基础设施。黑石总裁认为真正风险是算力短缺而非基建泡沫。
基础设施投资
特斯拉Cybercab量产版在奥斯汀启动公开道路工程测试
特斯拉在奥斯汀公共道路启动首批34台量产版Cybercab工程测试,车辆无方向盘与脚踏板,配有安全监督员。从2024年10月概念车首秀到实车上路约20个月,目前不对外开放乘客,主要验证硬件可靠性。此前奥斯汀已有无安全员Model Y无人驾驶出租于1月启用、6月22日开放付费服务。
自动驾驶特斯拉
Meta秘密测试ChatGPT等竞品:承包商假扮未成年发送数万条危机提示
Meta通过承包商Covelen发起代号"Cannes"的项目,雇佣数百人假扮未成年人向ChatGPT、Gemini和Character.AI发送超4.5万条关于自杀、自残、饮食障碍等的敏感提示。被测试公司不知情,Character.AI表示违反其服务条款。此举引发行业对AI安全测试边界与商业伦理的激烈讨论。
安全伦理
OpenAI Signals 数据揭示 ChatGPT 全球采用趋势
OpenAI Signals数据显示用户注册六个月后日均消息量增加50%,尝试任务种类翻倍。自2023年7月以来非洲和亚洲增速最快,低人类发展指数国家增长尤为显著。女性名字用户已占全球多数,非英语用户占活跃用户半数以上,其中乌兹别克语、哈萨克语和缅甸语用户占比增长百分比最大。
用户增长全球化
AI就业争论变得更加混乱
截至2026年5月,AI相关裁员接近9万个,预计未来五年美国最多15%的岗位将被AI替代。但Ramp与Revelio Labs对近22,000家公司的报告发现,高AI投入企业总员工数增长10.2%,入门级岗位增长12%。报告认为AI在资源充裕的科技企业中成为扩张工具,但仅购买订阅而未持续投入的公司未见人头增长,可能加剧企业间资源鸿沟。
就业劳动力市场
🔧 开源与开发者工具
ADK Go 2.0 发布:构建可靠的多智能体应用
Agent Development Kit for Go 2.0引入基于图的工作流引擎,用于组合复杂多智能体应用。新版本内置人工参与循环编排、纯Go代码的动态执行以及指数退避重试等自动弹性特性。统一执行模型后,单智能体与复杂图均运行在同一运行时上,简化了遥测与状态持久化。
多智能体Go
X(Twitter)发布 hosted X MCP,AI 智能体可直连 X API
X官方推出hosted X MCP,AI智能体可通过MCP协议直接调用X API获取实时信息,支持Grok、Cursor等工具。个人优惠价每次调用仅0.01美元,有用户实测拉取近三天书签仅花0.1美元。此举大幅降低了AI应用获取社交网络实时数据的门槛。
MCPAPI
一个人管理5款产品,80%时间不写代码?Every的复利工程
媒体软件公司Every公开「复利工程」方法论,以单人工程团队维护5款产品。核心四步循环中,Compound步骤将每次解决问题的解法写入CLAUDE.md和docs/solutions/,使AI下次自动避坑。工程师80%时间花在Plan和Review,仅20%用于写代码。配套开源插件含26个专项agent、23条工作流命令、13项技能。
工程方法论AI编程
用 shot-scraper video 让 AI 智能体录制工作演示视频
shot-scraper 1.10新增shot-scraper video命令,支持通过storyboard.yml文件定义操作步骤,利用Playwright录制浏览器视频。该功能依赖Playwright 1.61.0新增的screencast机制,解决了此前视频开头白帧、宽度固定等问题,为AI智能体工作流录制提供了轻量级自动化方案。
自动化录制
🎓 学术与前沿研究
AI 用 prover-verifier LLM 循环攻克 9 个未解数学难题
AI Safety Memes报道称,采用"prover-verifier"LLM循环的方法成功解决了理论计算机科学中9个重大开放问题,其中包括一个困扰研究者长达2年的难题。该研究由哥伦比亚大学合作者完成,并计划将这一方法扩展到所有科学领域,引发了对AI在数学发现领域潜力的广泛讨论。
数学LLM循环
Grant Sanderson 谈 AI 与数学的未来
3Blue1Brown创办人Grant Sanderson在与Dwarkesh Patel的对谈中指出,AI在IMO获金牌并不等于AGI,只是又一个被攻克的基准。即使AI解决千禧年大奖难题,仍可能存在大量人类任务无法被自动化。对话还探讨了Riemann假设的AI证明能否被人类理解、AI能否在已有文献间发现隐藏联系等深刻问题。
数学AGI
Claude Code 入门:智能体循环
Claude Code团队定义了四种智能体循环类型:turn-based、goal-based、time-based以及proactive循环,并介绍了如何编写SKIL规范。文章系统性地阐述了agent重复工作直到满足停止条件的完整机制,为开发者构建可靠AI智能体提供了理论基础和实践指南。
智能体循环工程实践
📝 编辑点评
今日热点清晰地勾勒出AI行业的三条主线:一是模型层进入"效率与性价比"竞争阶段,Claude Sonnet 5的激进定价与LongCat-2.0的超低推理成本表明,行业正从单纯追求性能转向兼顾商业可行性的务实路线。二是AI正从通用对话工具向垂直工作台进化,Claude Science与NotebookLM的视频功能标志着"AI即平台"趋势加速。三是基础设施投资持续升温,黑石300亿美元押注日本数据中心与特斯拉Cybercab上路测试,说明资本与产业界对AI长期价值的信心未减。值得关注的是,Meta秘密测试竞品安全性的争议与AI就业市场的矛盾数据,提示行业在高速发展的同时,伦理、安全与劳动力转型的复杂性正在加剧。数学难题的攻克固然振奋人心,但正如Grant Sanderson所言,我们仍需警惕将基准突破等同于通用智能的认知陷阱。
安卿辰博客







