AI日报 · 2026-05-26 - ephron's blog

模型发布/更新

1. SpaceXAI完成1.5T参数Grok V9-Medium模型训练，预告开源计划

Elon Musk宣布，1.5T参数的Grok基础模型V9-Medium已完成训练，进入微调和强化学习阶段，预计2-3周内发布，并计划年底开源0.5T参数的模型。X ↗

2. OpenBMB开源MiniCPM5-1B模型，登顶2B以下小模型榜单

OpenBMB开源MiniCPM5系列首个模型MiniCPM5-1B，具备混合推理能力，在Artificial Analysis小模型榜单登顶，成为2B以下最强模型。huggingface.co ↗

3. 传OpenAI GPT-5.6模型下月发布，上下文窗口达150万token

开发者在OpenAI Codex后端日志中发现未官宣的GPT-5.6模型（内部代号iris-alpha），上下文窗口将提升至150万token，较GPT-5.5提升约43%。IT之家（RSS） ↗

4. 阿里通义Qwen3.7-Max上线隐式缓存功能，更快更便宜

Qwen3.7-Max已自动启用隐式缓存，开箱即用可加速推理、降低成本。如需更高命中率，可使用显式缓存。X：通义千问 / Qwen (@Alibaba_Qwen) ↗

5. 谷歌Gemma 4搭配多token预测，推理速度提升至3倍

Gemma 4可搭配使用投机解码的多token预测草稿模型，实现多个token并行生成，显著提升推理速度，最高可达约3倍。InfoQ AI ↗

6. 面壁智能联合清华等开源中国首个华为昇腾1.58-bit端侧大模型BitCPM-CANN

面壁智能与清华大学等合作，开源了中国首个基于华为昇腾训练的1.58-bit端侧大模型BitCPM-CANN，推动低比特大模型发展。IT之家（RSS） ↗

产品与工具

7. xAI推出Grok Build Beta版，面向SuperGrok用户开放

Grok Build现已面向SuperGrok和X Premium+用户推出Beta版，支持Plan Mode、Imagine媒体生成和CLI自动化构建。X：xAI (@xai) ↗

8. Google Antigravity新增Gemini 3.5 Flash (Low)优化简单任务

Antigravity引入Gemini 3.5 Flash (Low)选项，生成token数较Medium版减少约45%以优化简单任务，并重置付费用户配额。X ↗

9. ima全面开放copilot Agent并上线Skill发布功能

ima取消排队限制，全面开放具备记忆与知识库的Agent copilot，同时知识号上线Skill发布功能，用户需更新应用。微信文章 ↗

10. 社区反馈Claude注册疑似取消手机验证并重开申诉入口

据社区反馈，Claude账号注册疑似取消手机号验证，同时开放了被封禁账号的申诉入口，降低了注册门槛。linux.do ↗

开发与工程

11. 微软推出MDASH系统，用于大规模AI漏洞研究

微软介绍了一个名为MDASH的新AI驱动漏洞发现系统，这是一个多模型智能体安全平台，用于大规模AI安全研究。InfoQ AI ↗

12. 安全报告：微软Copilot Cowork存在文件泄露问题

安全机构报告指出，微软Copilot Cowork功能存在安全漏洞，可能导致文件被意外泄露，需引起关注。Hacker News 热门（buzzing.cc 中文翻译） ↗

13. DeepSeek V4新工具缓存命中率达99.82%，成本降至2折

新工具可将DeepSeek V4的缓存命中率提升至99.82%，使原本高成本的调用费用大幅降低，实现2折稳定到手。量子位 ↗

行业与公司

14. 传苹果正使用定制版1.2T参数Google大模型重塑Siri

据称苹果为改造下一代Siri，正使用一个定制版、参数规模达1.2T的Google大模型作为核心，部分功能可能本地运行。X：Kim (@kimmonismus) ↗

15. OpenAI与巴西媒体集团达成内容合作，将新闻引入ChatGPT

OpenAI与巴西媒体集团Grupo Folha和Grupo UOL合作，将可信新闻内容引入ChatGPT，扩展新闻访问并确保归属与透明度。OpenAI：官网动态（RSS · 排除企业/客户案例） ↗

16. Waymo因遇水问题大规模召回，叫停多城Robotaxi服务

Waymo因车辆遇水可能导致瘫痪的问题进行大规模召回，并叫停了多个城市的Robotaxi服务，影响运营。量子位 ↗

17. 2026智源大会定档，图灵奖得主领衔探讨AI下一程

2026智源大会将举行，由图灵奖得主领衔，集结中国大模型第一梯队，探讨AI未来发展方向，报名已开放。量子位 ↗

18. 2026投资界SuperLink大会定档6月，打造创投超级枢纽

2026投资界SuperLink大会将于6月10-11日举行，旨在打造创投生态的超级枢纽，促进投资合作。量子位 ↗

19. 京东JoyInside戴文军：AI的终极形态是融入万物，而非聊天

戴文军在AIGC2026上表示，AI的终极形态不是聊天，而是融入家庭每一件物品，硬件应主动适应人。量子位 ↗

20. 华为具身大脑一号位创业，用认知科学造世界模型，获亿元融资

华为具身大脑负责人创业，使用认知科学构建世界模型，用于具身智能，已获得亿元级融资。量子位 ↗

论文与研究

21. 华为何庭波提出‘韬定律’，逻辑折叠技术提升芯片性能

华为何庭波在ISCAS 2026上提出‘韬定律’，介绍逻辑折叠技术，通过三维空间拓扑重组提升芯片性能，在麒麟2026芯片测试中显著提升晶体管密度。IT之家（RSS） ↗

22. 蚂蚁灵波LingBot-VA论文被机器人顶会RSS 2026接收

蚂蚁灵波的LingBot-VA论文被机器人顶会RSS 2026接收，该技术能让机器人边推演、边行动，获得国际认可。量子位 ↗

23. Hugging Face博客：厘清AI智能体关键术语Harness与Scaffold

文章旨在厘清AI智能体领域易混淆的术语，解释模型本身是无记忆的大语言模型，行为由Scaffolding塑造，由Harness执行。Hugging Face：Blog（RSS） ↗

人物与花絮

24. Anthropic联合创始人Chris Olah谈AI安全：外部监督至关重要

Chris Olah在梵蒂冈教皇通谕发布会上指出，所有前沿AI实验室都面临多重压力，外部监督至关重要，AI模型并非像飞机那样可控。Anthropic：Newsroom（网页） ↗

25. 教皇里奥发布通谕，呼吁在AI时代保持深刻人性

教皇里奥十四世在首份重要通谕中警告AI及不受约束的技术风险，讨论AI驱动战争、对劳动的影响等议题。The Verge：AI（RSS） ↗

观点与教程

26. SaaS-Bench评测：Claude等模型在真实办公任务中通过率不足4%

UniPat AI发布SaaS-Bench评测，显示Claude等主流大模型在真实办公任务中完全通过率最高仅3.8%，表明AI全自动办公远未落地。量子位 ↗

27. 蚂蚁灵波沈宇军：VLA和世界模型非终局，需物理世界专属模型

沈宇军在AIGC2026上表示，VLA和世界模型都不是终局，需要物理世界独有的模型，目标是做机器人时代的安卓系统。量子位 ↗

28. 硅谷投资人张璐：未来推理将吃掉70%算力，30%留给训练

张璐在AIGC2026上表示，未来推理将占据70%的算力，训练只占30%，AI关键词正在被重新定义。量子位 ↗

AI日报 · 2026-05-26