模型发布/更新

1. SpaceXAI完成1.5T参数Grok V9-Medium模型训练,预告开源计划

Elon Musk宣布,1.5T参数的Grok基础模型V9-Medium已完成训练,进入微调和强化学习阶段,预计2-3周内发布,并计划年底开源0.5T参数的模型。X ↗

2. OpenBMB开源MiniCPM5-1B模型,登顶2B以下小模型榜单

OpenBMB开源MiniCPM5系列首个模型MiniCPM5-1B,具备混合推理能力,在Artificial Analysis小模型榜单登顶,成为2B以下最强模型。huggingface.co ↗

3. 传OpenAI GPT-5.6模型下月发布,上下文窗口达150万token

开发者在OpenAI Codex后端日志中发现未官宣的GPT-5.6模型(内部代号iris-alpha),上下文窗口将提升至150万token,较GPT-5.5提升约43%。IT之家(RSS) ↗

4. 阿里通义Qwen3.7-Max上线隐式缓存功能,更快更便宜

Qwen3.7-Max已自动启用隐式缓存,开箱即用可加速推理、降低成本。如需更高命中率,可使用显式缓存。X:通义千问 / Qwen (@Alibaba_Qwen) ↗

5. 谷歌Gemma 4搭配多token预测,推理速度提升至3倍

Gemma 4可搭配使用投机解码的多token预测草稿模型,实现多个token并行生成,显著提升推理速度,最高可达约3倍。InfoQ AI ↗

6. 面壁智能联合清华等开源中国首个华为昇腾1.58-bit端侧大模型BitCPM-CANN

面壁智能与清华大学等合作,开源了中国首个基于华为昇腾训练的1.58-bit端侧大模型BitCPM-CANN,推动低比特大模型发展。IT之家(RSS) ↗

产品与工具

7. xAI推出Grok Build Beta版,面向SuperGrok用户开放

Grok Build现已面向SuperGrok和X Premium+用户推出Beta版,支持Plan Mode、Imagine媒体生成和CLI自动化构建。X:xAI (@xai) ↗

8. Google Antigravity新增Gemini 3.5 Flash (Low)优化简单任务

Antigravity引入Gemini 3.5 Flash (Low)选项,生成token数较Medium版减少约45%以优化简单任务,并重置付费用户配额。X ↗

9. ima全面开放copilot Agent并上线Skill发布功能

ima取消排队限制,全面开放具备记忆与知识库的Agent copilot,同时知识号上线Skill发布功能,用户需更新应用。微信文章 ↗

10. 社区反馈Claude注册疑似取消手机验证并重开申诉入口

据社区反馈,Claude账号注册疑似取消手机号验证,同时开放了被封禁账号的申诉入口,降低了注册门槛。linux.do ↗

开发与工程

11. 微软推出MDASH系统,用于大规模AI漏洞研究

微软介绍了一个名为MDASH的新AI驱动漏洞发现系统,这是一个多模型智能体安全平台,用于大规模AI安全研究。InfoQ AI ↗

12. 安全报告:微软Copilot Cowork存在文件泄露问题

安全机构报告指出,微软Copilot Cowork功能存在安全漏洞,可能导致文件被意外泄露,需引起关注。Hacker News 热门(buzzing.cc 中文翻译) ↗

13. DeepSeek V4新工具缓存命中率达99.82%,成本降至2折

新工具可将DeepSeek V4的缓存命中率提升至99.82%,使原本高成本的调用费用大幅降低,实现2折稳定到手。量子位 ↗

行业与公司

14. 传苹果正使用定制版1.2T参数Google大模型重塑Siri

据称苹果为改造下一代Siri,正使用一个定制版、参数规模达1.2T的Google大模型作为核心,部分功能可能本地运行。X:Kim (@kimmonismus) ↗

15. OpenAI与巴西媒体集团达成内容合作,将新闻引入ChatGPT

OpenAI与巴西媒体集团Grupo Folha和Grupo UOL合作,将可信新闻内容引入ChatGPT,扩展新闻访问并确保归属与透明度。OpenAI:官网动态(RSS · 排除企业/客户案例) ↗

16. Waymo因遇水问题大规模召回,叫停多城Robotaxi服务

Waymo因车辆遇水可能导致瘫痪的问题进行大规模召回,并叫停了多个城市的Robotaxi服务,影响运营。量子位 ↗

17. 2026智源大会定档,图灵奖得主领衔探讨AI下一程

2026智源大会将举行,由图灵奖得主领衔,集结中国大模型第一梯队,探讨AI未来发展方向,报名已开放。量子位 ↗

18. 2026投资界SuperLink大会定档6月,打造创投超级枢纽

2026投资界SuperLink大会将于6月10-11日举行,旨在打造创投生态的超级枢纽,促进投资合作。量子位 ↗

19. 京东JoyInside戴文军:AI的终极形态是融入万物,而非聊天

戴文军在AIGC2026上表示,AI的终极形态不是聊天,而是融入家庭每一件物品,硬件应主动适应人。量子位 ↗

20. 华为具身大脑一号位创业,用认知科学造世界模型,获亿元融资

华为具身大脑负责人创业,使用认知科学构建世界模型,用于具身智能,已获得亿元级融资。量子位 ↗

论文与研究

21. 华为何庭波提出‘韬定律’,逻辑折叠技术提升芯片性能

华为何庭波在ISCAS 2026上提出‘韬定律’,介绍逻辑折叠技术,通过三维空间拓扑重组提升芯片性能,在麒麟2026芯片测试中显著提升晶体管密度。IT之家(RSS) ↗

22. 蚂蚁灵波LingBot-VA论文被机器人顶会RSS 2026接收

蚂蚁灵波的LingBot-VA论文被机器人顶会RSS 2026接收,该技术能让机器人边推演、边行动,获得国际认可。量子位 ↗

23. Hugging Face博客:厘清AI智能体关键术语Harness与Scaffold

文章旨在厘清AI智能体领域易混淆的术语,解释模型本身是无记忆的大语言模型,行为由Scaffolding塑造,由Harness执行。Hugging Face:Blog(RSS) ↗

人物与花絮

24. Anthropic联合创始人Chris Olah谈AI安全:外部监督至关重要

Chris Olah在梵蒂冈教皇通谕发布会上指出,所有前沿AI实验室都面临多重压力,外部监督至关重要,AI模型并非像飞机那样可控。Anthropic:Newsroom(网页) ↗

25. 教皇里奥发布通谕,呼吁在AI时代保持深刻人性

教皇里奥十四世在首份重要通谕中警告AI及不受约束的技术风险,讨论AI驱动战争、对劳动的影响等议题。The Verge:AI(RSS) ↗

观点与教程

26. SaaS-Bench评测:Claude等模型在真实办公任务中通过率不足4%

UniPat AI发布SaaS-Bench评测,显示Claude等主流大模型在真实办公任务中完全通过率最高仅3.8%,表明AI全自动办公远未落地。量子位 ↗

27. 蚂蚁灵波沈宇军:VLA和世界模型非终局,需物理世界专属模型

沈宇军在AIGC2026上表示,VLA和世界模型都不是终局,需要物理世界独有的模型,目标是做机器人时代的安卓系统。量子位 ↗

28. 硅谷投资人张璐:未来推理将吃掉70%算力,30%留给训练

张璐在AIGC2026上表示,未来推理将占据70%的算力,训练只占30%,AI关键词正在被重新定义。量子位 ↗