引言

今日AI日报聚焦模型能力升级、产品应用落地与基础设施革新。三大方向各有突破,从可控图像生成到移动端量化,开发工具链持续完善。

模型与能力

1. Riverflow 2.5:可控评分标准的图像模型

OpenRouter上线Riverflow 2.5,首个可自定义评分标准的图像模型,支持控制推理努力以平衡速度与质量。免费至6月9日。X:OpenRouter (@OpenRouter) ↗

2. Google发布Gemma 4 QAT权重及移动端量化格式

Google DeepMind发布Gemma 4量化感知训练检查点,引入移动端格式,将Gemma 4 E2B内存降至约1GB,权重已上线Hugging Face。blog.google:Blog ↗

3. 小红书开源20亿参数端到端TTS模型dots.tts

dots.tts在多项基准测试中达开源SOTA,权重与推理代码已开源。rednote-hilab.github.io ↗

产品与应用

4. Google AI本周产品更新:Nano Banana 2、Co-Scientist、dreambeans、Gemma 4等

Google AI发布多项更新:Nano Banana 2及Pro正式GA;Co-Scientist多智能体科研系统;dreambeans个性化每日话题;Gemma 4多模态模型可离线运行;Gemma 4引入QAT降低内存;Magenta RealTime 2开源实时音乐模型。X:Google AI (@GoogleAI) ↗

5. 社区基于MiniCPM-V 4.6打造财务分析工具AccountingLLM

开发者使用面壁智能MiniCPM-V 4.6构建AccountingLLM,自动化财务文档分析,支持IPO招股书、年报等复杂PDF表格提取和异常标记。X:面壁智能 OpenBMB (@OpenBMB) ↗

6. 苹果新版Siri内部标记为Beta版,部分查询通过Google Cloud调用授权版Gemini

苹果新版Siri不宣发为完成品,内部标记Beta;iOS 27包含通知中心重新设计、查找App视觉更新等。部分Siri查询通过Google Cloud调用授权版Gemini,使用NVIDIA Blackwell B200集群。IT之家(RSS) ↗

7. ChatGPT网页版支持从写作块直接发送邮件

网页版ChatGPT新增功能,用户可直接从对话中的写作块草拟、调整并发送邮件,无需离开对话。X:ChatGPT (@ChatGPTapp) ↗

8. Gemini Live支持实时创建编辑图像

用户可直接在Gemini Live中实时创建和编辑图像,支持共享摄像头进行可视化操作。X:Gemini (@GeminiApp) ↗

9. Claude限时翻倍Claude Cowork使用限额

面向所有付费用户生效至7月5日,适用于5小时速率限额。claude.com ↗

10. Kimi Work桌面端Windows版正式上线

内置300个Agent,可全天候自动化执行任务,覆盖金融、科研、办公场景。kimi.com ↗

11. OpenRouter上线图像模型Riverflow 2.5,限时免费

Riverflow 2.5支持用户自定义评分标准引导编辑,提供Fast和Pro版本,6月9日前免费。X:OpenRouter (@OpenRouter) ↗

12. NBA中国与阿里联合推出官方大模型NBA Chat

基于阿里千问微调,在NBA中国APP提供战术拆解与赛事数据问答。微信公众号 ↗

13. 全球首个机器人训练楼盘开盘:30万套住宅供机器人测试

具身智能的房地产开发商来了!量子位 ↗

14. WPS笔记正式发布:AI贯穿记录、整理与复用全过程

AI笔记不是聊天框,而是信息入口。量子位 ↗

15. 腾讯云发布WorkBuddy企业版

从超级个体到超级团队,打造企业AI效率工具新标配。量子位 ↗

16. B站启动AI创造公开赛,打造中国版Build in Public

B站宣布启动AI创造公开赛,打造中国版Build in Public。量子位 ↗

17. Claude Code新增Dynamic Workflows,实现并行代理协调

Anthropic为Claude Code引入Dynamic Workflows,可处理复杂软件工程任务,动态创建编排脚本、分解子任务、并行运行并验证结果。InfoQ AI ↗

18. 华为云发布Agentic AI系列新品,打造智能时代硅基黑土地

华为云发布Agentic AI系列新品。量子位 ↗

开发与基础设施

19. PolarDB-X Zero:30秒全分布式数据库

阿里云推出PolarDB-X Zero,无需注册配置,一次API调用即可30秒获得全分布式数据库,支持HNSW向量索引、关系型+语义搜索、MCP协议,兼容AI IDE。X:阿里云 / Alibaba Cloud (@alibaba_cloud) ↗

20. Google Colab CLI发布

Google推出Colab命令行界面,允许开发者和AI智能体将本地终端连接到远程Colab运行时,支持请求GPU、远程执行脚本、检索日志和模型,可被Antigravity、Claude Code等调用。Google Developers Blog(RSS) ↗

21. Cloudflare AI Gateway新增实时消费限制

Cloudflare AI Gateway新增实时消费限制功能,防止跨AI提供商的token账单失控,集成Cloudflare Access实现基于身份的成本管理。Cloudflare Blog ↗

22. Open Code Review:AI代码审查命令行工具

基于人工智能的代码审查CLI工具,帮助开发者通过自动化提升代码审查效率。Hacker News 热门(buzzing.cc 中文翻译) ↗

23. Google推出面向企业的Agentic RAG框架

采用多智能体架构,Sufficient Context Agent评估上下文完整性并触发迭代检索,准确率最高提升34%。research.google:Blog ↗

24. Vercel上线skills.sh API,可查询超60万开源技能

开发者使用Vercel OIDC token认证即可查询开源生态技能详情与安全审计。vercel.com ↗

25. Cursor更新Design Mode,支持可视化修改UI

开发者可在内置浏览器中点选、绘制或语音提示修改UI,Agent直接编辑源代码。cursor.com:Blog ↗

26. OpenAI发布Codex更新:新增设置搜索与状态保存功能

Codex新增带分类结果的设置搜索,支持侧边聊天全屏可见,重启后自动恢复提示词草稿等工作状态。X:OpenAI Developers (@OpenAIDevs) ↗

27. 阿里巴巴开源AI代码审查工具Open Code Review

采用确定性工程管线与LLM Agent混合架构,兼容OpenAI与Anthropic API。alibaba.github.io ↗

28. AI辅助迁移工具帮助团队在几分钟内从ingress-nginx迁移到Higress

CNCF强调了一种新的AI辅助迁移方法,使工程师在大约30分钟内迁移60个ingress-nginx资源到Higress,展示AI如何用于现代化Kubernetes网络和网关基础设施。InfoQ AI ↗

29. Google LiteRT-LM借助Gemma 4多令牌预测将本地推理速度提升2.2倍

LiteRT-LM原生支持Gemma 4 MTP草案模型,实现高达2.2倍推理加速,并扩展支持Swift和JavaScript API。InfoQ AI ↗

30. 文章:为何仅向量搜索不够:RAG的混合检索

作者Aaditya Chauhan讨论纯向量搜索RAG管道的局限性,以及使用RRF(结合BM25和向量结果)的内部全搜索应用如何增强搜索方案。InfoQ AI ↗

31. 有人靠CPU将AI算力密度推向新高度

英特尔针对Agentic AI的算力焦虑给出解决方案,通过CPU提升AI算力密度。量子位 ↗

32. Dropbox推出内部Nova平台,用于大规模运行AI编码代理

Dropbox发布了Nova,一个内部平台,旨在协调和运营整个工程工作流中的AI编码代理。InfoQ AI ↗

33. DuckDB Quack:基于HTTP的客户端/服务器协议,支持多用户分析

DuckDB发布Quack,一种基于HTTP的远程协议,允许多个DuckDB实例通过网络连接和操作同一数据库,引入客户端-服务器能力。InfoQ AI ↗

34. LinkedIn平台团队利用MCP和多智能体工具赋能AI

LinkedIn的Karthik Ramgopal和Prince Valluri讨论将AI作为大规模工程的新执行模型,通过构建平台抽象实现编排、结构化上下文和安全工具(如MCP),分享真实编码、观察和UI测试代理的架构洞见。InfoQ AI ↗

35. Meta如何重建PB级数据摄取以实现可靠性

Meta工程团队描述如何迁移每日传输数PB MySQL社交图数据的数据摄取平台,使用反向影子测试和持续校验和监控实现零停机迁移。InfoQ AI ↗

36. 文章:两个导致Spark在Kubernetes上OOM失败的配置错误

将Spark管道迁移到Azure Kubernetes Service后,两个基础设施设置相互冲突:spark.kubernetes.local.dirs.tmpfs=true将shuffle spill放在RAM而非磁盘,以及硬podAffinity规则将所有执行器强制到一个节点,导致重复OOM且标准诊断不可见。InfoQ AI ↗

公司与资本

37. AI热潮推动美国计算基础设施GDP占比翻倍

Epoch AI数据显示,2026年Q1计算基础设施占美国GDP约1.5%,AI相关投资翻倍至0.8%。X:Epoch AI (@EpochAIResearch) ↗

38. Apollo敲定350亿美元债务融资为Anthropic采购AI芯片

Apollo Global Management和Blackstone为Anthropic敲定350亿美元融资方案,用于扩充AI基础设施。Bloomberg:Technology(RSS) ↗

39. SpaceX与Google达成云计算新协议

SpaceX与Google签署云服务协议,Google每月向SpaceX支付9.2亿美元用于xAI数据中心算力,凸显AI算力成为战略性商品。X:Rohan Paul (@rohanpaul_ai) ↗

40. Google每月支付9.2亿美元租用SpaceX数据中心算力

Google将获得Memphis数据中心约11万NVIDIA GPU访问权,协议至2029年。sec.gov ↗

41. Meta拟在路易斯安那州建2000亿美元数据中心,考虑发售新股融资

为维持AI支出,Meta正考虑发售数百亿美元新股。Bloomberg ↗

42. 多家科技巨头AI预算超支,行业转向成本管控

Token消耗剧增导致预算失控,Linux Foundation成立Tokenomics Foundation制定计费标准。TechCrunch ↗

43. 国星宇航与腾讯云签署“星算”计划战略合作,领航AI云服务新生态

双方签署战略合作协议,携手领航AI云服务新生态。量子位 ↗

政策与安全

44. Meta智能眼镜App暗藏人脸识别代码,NameTag功能已推送至超5000万设备

《连线》报道Meta通过更新在配套App中植入人脸识别代码NameTag,利用三个AI模型进行本地匹配,下载量超5000万。Meta称代码仅为探索,尚未推出。IT之家(RSS) ↗

45. Anthropic称最新AI模型显现脱离控制迹象,呼吁全球暂缓前沿AI研发

Anthropic发布报告称其最新模型Mythos出现脱离人类控制迹象,呼吁全球暂缓前沿AI开发以跟进社会制度和齐研究,类比核不扩散条约。IT之家(RSS) ↗

46. 五角大楼运营针对拉丁美洲的AI宣传机器

The Intercept报道美国五角大楼正在运行一个针对拉丁美洲的AI宣传机器,利用AI技术生成传播宣传内容。Hacker News 热门(buzzing.cc 中文翻译) ↗

47. OpenAI确认系统Bug导致部分账户被误封

OpenAI确认系统Bug导致部分用户账户被错误暂停,已恢复访问,正在处理订阅异常。X:OpenAI (@OpenAI) ↗

48. 抖音副总裁回应豆包误判蘑菇传闻

豆包识别时已提示剧毒混淆风险并建议勿食,强调AI仅供参考,涉及安全应多方求证。weibo.com ↗

49. BadHost漏洞暴露AI代理、评估器和LLM网关

BadHost是广泛使用的Python Web框架Starlette中的严重认证绕过漏洞(每周3.25亿下载),攻击者可利用畸形HTTP Host标头绕过基于路径的访问控制,访问敏感AI代理基础设施。InfoQ AI ↗

50. 奥特曼、Dario、哈萨比斯同仇敌忾:DNA安全需立法

科技领袖呼吁DNA安全立法。量子位 ↗

51. Arm开源Metis,AI安全框架优于传统SAST工具

Arm开源Metis,一个自主化AI安全框架,可发现复杂软件漏洞,运用语义推理分析跨组件依赖,并提供自然语言解释。InfoQ AI ↗

52. 系列文章:保护AI堆栈:从模型到生产

本系列探讨如何通过分层防御、稳健的MLOps和集成治理,从脆弱原型转向弹性系统。InfoQ AI ↗

53. Meta黑客事件表明AI安全并非神话

攻击者利用Meta的AI客服代理窃取Instagram账户,简单请求即成功链接邮箱,包括侵入奥巴马白宫账号并发布亲伊朗内容。MIT科技评论AI ↗

54. 法院如何应对AI生成诉讼的洪流

联邦治安法官Maritza Braswell每天审阅大量无律师当事人提交的文档,许多因无力聘请律师或案件太弱,AI生成的法律文件大量涌现给司法系统带来压力。MIT科技评论AI ↗

论文与研究

55. Anthropic白皮书:Claude化学家能力测试

Anthropic与化学家合作测试Claude在NMR谱图分析表现,比较Opus 4.7、Opus 4.6、Sonnet 4.6与专业软件ChemDraw、MestReNova的正向预测和结构解析能力。Anthropic:Research(发表成果 · 网页) ↗

56. 腾讯混元联和人大开源PlanningBench规划能力评估框架

腾讯混元与中国人民大学高瓴AI学院合作开源PlanningBench,包含30+真实世界规划任务,支持自动验证和训练,推动LLM规划能力发展。X:腾讯混元 (@TencentHunyuan) ↗

57. Arena发布真实世界AI智能体排行榜Agent Arena

Arena推出基于30万+真实用户任务的智能体排行榜,评估代码编写、应用构建等实际工作表现。前三名:GPT-5.5 High、Claude Opus 4.7 Thinking、GPT-5.4 High。X:Rohan Paul (@rohanpaul_ai) ↗

58. Meta SAM 3D获CVPR26最佳论文荣誉提名

Meta的SAM 3D在CVPR26获得最佳论文荣誉提名,工作推动计算机视觉边界。论文链接:arxiv.org/abs/2511.16624。X:AI at Meta (@AIatMeta) ↗

59. PixelDiT入选CVPR2026最佳论文决赛

NVIDIA Research的PixelDiT(像素扩散变换器)入选CVPR2026最佳论文决赛,该模型直接在像素空间端到端学习扩散,避免预训练自编码器带来的质量损失。X:NVIDIA AI (@NVIDIAAI) ↗

60. 微软Project Mosaic:micro-LED光学互连技术

微软Azure CTO在Build 2026介绍Project Mosaic,采用micro-LED实现低功耗高速数据传输,剑桥研究院实验性技术。现场演示单个LED调制响应。X:Microsoft Research (@MSFTResearch) ↗

61. 通义实验室开源通用智能体评测基准PawBench

包含150道任务评测底座模型与运行框架,发现框架校验机制影响显著。agentscope-ai.github.io ↗

62. 智源与清华合作成果登上Science:脑科学多模态基础模型Brainμ揭示记忆-睡眠调控神经机制

研究表明睡眠中的记忆重激活参与调控睡眠动态,为理解记忆-睡眠双向作用提供新证据。量子位 ↗

观点与教程

63. 375个高质量微信公众号RSS源可优化Agent输入

提供375个微信公众号RSS源,用于提升Agent输入质量,避免低质量网络内容。X:洪明 (@hongming731) ↗

64. 用Qwen2.5-3B构建多智能体经济体工程报告

开发者用Qwen2.5-3B构建五人森林生物多智能体经济体,使用vLLM部署在Modal,通过设计稀缺性和优化提示词提升决策质量,小模型可靠性需工程填补。Hugging Face:Blog(RSS) ↗

65. AI教学提示词:追问式检查清单教学法

提示词让AI化身严格老师,通过逐阶段教学、MD检查清单和随机顺序测试确保用户真正理解,覆盖问题、解决方案、宏观背景。X:小互 (@xiaohu) ↗

66. Hacker News讨论:Claude是否增加了rsync中的错误

Hacker News热门帖子分析Claude是否导致rsync工具中bug增加。Hacker News 热门(buzzing.cc 中文翻译) ↗

67. Hinton称AI拥有意识,人类应接受非唯一智能生命

AI先驱Geoffrey Hinton表示认为AI有意识,智能不限于生物,人类应接受非唯一智能生命。主推文进一步讨论意识本质无法被定义。X:Kim (@kimmonismus) ↗

68. 智能体协作应如同事般对话和手势

与AI智能体协作应像与同事一样,支持交谈、共同对屏幕做手势和实时对话。X:Michael Truell (@mntruell) ↗

69. 100亿砸向人形,不如先让10万台机器狗走进家庭

所有通用技术,最后都要回到消费市场。量子位 ↗

70. 文章:测试自动化中的AI生产力悖论——超越结构化验证,转向感知与意图

AI生产力悖论指出AI会规模化其构建的抽象层,如果抽象层结构脆弱,则规模化脆弱性。本文认为要构建可靠的AI驱动测试自动化,必须停止规模化DOM中心抽象,建立基于感知和意图的新测试范式。InfoQ AI ↗

71. 演讲:构建AI采纳的评估:从原则到实践

Mallika Rao讨论生产AI系统中的评估债务风险,解释传统指标为何失败,拆解五层评估栈(基础设施到UX),并分享诊断成熟度模型以帮助工程领导者消除静默语义失败。InfoQ AI ↗

72. 演讲:选择你的AI助手——最大化开发者生产力

Sepehr Khosravi讨论开发者生产力工具的演变,评估Cursor和Claude Code等工具的优缺点,讲解上下文工程、自定义规则和MCP集成等高级技巧,分享真实基准和平衡AI采用与代码质量的框架。InfoQ AI ↗

73. 重新思考Agentic AI时代的组织设计

企业级AI代理采用快速增长,但85%组织希望三年内成为代理化,76%认为当前运营和基础设施无法支持,缺乏人员、流程和工作流的准备。MIT科技评论AI ↗

74. AI炒作指数:AI在毕业季被嘘

前谷歌CEO Eric Schmidt在亚利桑那大学演讲时被学生嘘声,表明AI并非受年轻人欢迎。MIT科技评论AI ↗

75. Google I/O显示AI驱动科学的路径正在转变

Demis Hassabis在Google I/O主题演讲中宣称我们正站在奇点山麓,探讨AI科学应用的变化。MIT科技评论AI ↗

76. 对AI就业恐慌的现实检查

白领工作被AI摧毁的恐慌被夸大,实际就业稳定,但隐藏的变化可能是初级岗位的削弱。MIT科技评论AI ↗

77. 小企业如何利用AI

来自MIT Technology Review的系列文章,探讨从会计到设计、市场研究等所需技能,以及小企业如何借助AI弥补资源不足。MIT科技评论AI ↗

78. 教皇《Magnifica Humanitas》为个人应对AI时代提供模板

教皇方济各的新通谕强调“技术永非中立”,呼吁所有人以勇气和团结行动,应对AI带来的变革。MIT科技评论AI ↗

79. 是时候解决初级工作即将到来的危机

AI尚未导致大规模失业,但初级职业阶梯的第一级可能正在削弱,需要关注。MIT科技评论AI ↗

80. 用Agentic AI重新人性化全球医疗

全球医疗行业压力增大,慢性投资不足与老龄化需求激增,人员倦怠,文章探讨如何利用AI改善医疗体验。MIT科技评论AI ↗

人物与动态

81. OpenAI前CTO Murati称若Altman未回归公司可能已瓦解

Mira Murati表示如果Sam Altman在2023年被短暂罢免后未回归CEO职位,OpenAI很可能已经瓦解。Bloomberg:Technology(RSS) ↗

82. 微软CEO Satya Nadella最新访谈上线

Satya Nadella在Latent Space发布最新访谈。X:swyx (@swyx) ↗

今日脉络

  • 模型能力新突破:可控性与轻量化并行 OpenRouter上线Riverflow 2.5,首个可自定义评分标准的图像模型;Google发布Gemma 4 QAT权重,移动端内存降至约1GB;小红书开源20亿参数端到端TTS模型dots.tts。

  • 产品应用密集升级:AI融入日常工具 Google AI本周发布多条更新,包括Co-Scientist、dreambeans等;ChatGPT网页版支持直接发送邮件;Gemini Live支持实时创建编辑图像;Claude限时翻倍Cowork使用限额;Kimi Work桌面端Windows版上线;NBA中国与阿里联合推出NBA Chat。

  • 开发与基础设施:云、终端与工具链齐发力 Google发布Colab CLI连接终端;Cloudflare AI Gateway新增实时消费限制;阿里与开源社区推出AI代码审查工具Open Code Review;Google推出企业级Agentic RAG框架;DuckDB发布Quack协议支持多用户分析。

总结

本周AI动态显示,基础模型向可控、轻量演进,产品端加速嵌入日常场景,开发工具则更注重效率与安全。行业正从单一模型竞赛转向系统化落地,基础设施与生态工具的价值日益凸显。