导览

今天,多家头部公司的发布将竞争焦点从模型参数规模,明确转向了支撑智能体(Agent)落地的工具调用、长期记忆与结构化数据生成等“毛细血管”能力。

模型发布/更新

1. MiniMax M3:前沿编码、100万token上下文与原生多模态一体模型

MiniMax M3 是一款开源前沿模型,具备先进编码与AI智能体能力,支持100万token上下文。它采用新型稀疏注意力架构MSA,在长上下文下大幅降低计算成本并提升处理速度。在SWE-Bench Pro编码基准测试中表现优异。minimax.io:Blog ↗

2. xAI发布Composer 2.5

xAI的最新编程模型Composer 2.5已在Grok Build中上线。该模型快速、先进,擅长处理长时间任务和复杂指令,面向SuperGrok和X Premium+用户开放使用。x.ai ↗

3. 使用NVIDIA Cosmos 3开发物理AI推理、世界与行动模型

NVIDIA Cosmos 3是面向物理AI的基础模型,融合了物理推理、世界理解与行动生成能力。它能帮助机器人、自动驾驶车辆和智能空间理解世界、预测事件并生成适应特定环境和任务的行动。developer.nvidia.com:Blog ↗

4. SenseNova新模型解决AI图表生成难题

AI生成图表常存在数值错误和布局问题。SenseNova-U1模型专为解决此类问题设计,能生成准确的图表,并支持实时调整设计和布局。模型和效果案例已在Hugging Face和GitHub公开。X:@SenseTime_AI ↗

5. 介绍 Mellum2:JetBrains 推出的 12B 混合专家模型

JetBrains在Hugging Face发布其混合专家模型Mellum2,该模型参数规模为120亿,旨在提供强大的性能和效率。Hugging Face:Blog ↗

6. Nemotron 3 Ultra 本周即将发布

NVIDIA的Nemotron 3 Ultra模型计划于本周发布。X:@NVIDIAAI ↗

产品与工具

7. Qwen3.7-Plus:多模态智能体智能

Qwen Studio提供全面的多模态功能,涵盖聊天机器人、图像与视频理解、图像生成、文档处理、网页搜索、工具使用及智能体创建,旨在为用户提供一体化的智能体解决方案。qwen.ai:Blog ↗

8. Auto Router 新增成本质量权衡参数

Auto Router新增cost_quality_tradeoff参数(范围0-10),允许用户调整成本与质量间的权衡。设为0时优先选择最强模型,设为10时则选择最便宜的模型。X:@OpenRouter ↗

9. OpenAI前沿模型与Codex现可在AWS上使用

OpenAI的前沿模型与Codex现已在AWS上全面可用。企业客户可通过其现有的AWS环境、控制与采购流程来使用OpenAI的AI技术,加速部署进程。OpenAI:官网动态 ↗

10. Replit 用单个提示词构建完整业务

Replit推出新功能,允许用户通过单个提示词,免费构建包含网站、移动应用、幻灯片和发布视频的完整业务雏形,并能集成Stripe、Atlas等工具来运营业务。X:@Replit ↗

11. 腾讯混元发布智能体长期记忆插件Hy-Memory

腾讯混元发布专为长期协作智能体设计的记忆插件Hy-Memory。它基于多层记忆框架构建,能解决记忆碎片化问题,显著提升信息密度、降低token消耗并加快记忆更新速度。X:@TencentHunyuan ↗

12. NVIDIA 发布工厂运营蓝图,为工厂提供自主智能管理智能体

NVIDIA发布工厂运营蓝图(FOX),这是一个用于构建自主工厂管理智能体的参考设计。该蓝图基于NVIDIA NemoClaw、AI-Q Blueprint和Nemotron开源模型构建,旨在为工厂提供统一的决策层。blogs.nvidia.com:Blog ↗

13. ChatGPT 新增长文编辑与保存功能

ChatGPT现支持在全屏模式下编辑更长的文章,并可将文章保存到个人资料库中,以便用户后续继续编辑。X:@ChatGPTapp ↗

14. Perplexity发布Search as Code搜索架构

Perplexity推出全新搜索架构Search as Code,专为AI智能体设计。它通过直接编写Python代码来调用搜索栈,现已在Perplexity Agent API中提供,并成为Computer的默认选项。X:@perplexity_ai ↗

15. Gemini Omni支持创建个人数字分身

Gemini Omni推出新功能,允许用户创建外观和声音与自己相似的数字分身,并可将其添加到Gemini生成的视频创作中。X:@GeminiApp ↗

16. Claude Code Adds Dynamic Workflows for Parallel Agent Coordination

Claude Code新增Dynamic Workflows功能,旨在通过协调单个工作流中大量AI智能体,来处理复杂的软件工程任务,实现并行智能体协作。InfoQ AI ↗

17. 今天起,无限期免费!全球首个全模态API开放,Top 10 AI Lab出手

某AI实验室宣布,即日起无限期免费开放全球首个全模态API,支持文本、图像、视频等多种模态的输入和生成。该实验室被描述为全球顶尖AI实验室之一。量子位 ↗

开发与工程

18. OpenBMB发布UltraData两大开源数据集,登顶HuggingFace趋势榜

OpenBMB联合清华NLP与Modelbest发布两个开源数据集:Ultra-FineWeb-L3是迄今最大的开源中文预训练合成数据集;UltraData-SFT-2605是中国首个包含思考与非思考标注的大规模SFT数据集。两者均已开源。X:@OpenBMB ↗

19. 作者分享使用 Codex App 开发的开源项目合集

作者分享了使用Codex App等工具开发的一系列开源项目,包括Chrome插件、网站和AI Skill等。项目基于GPT-Image-2 API等技术,并整合了多个开源项目。X:@vista8 ↗

20. 使用Claude Opus 4.8将书籍转化为AI技能的教程

本文提供了一个六步教程,演示如何使用Claude Opus 4.8模型将书籍内容转化为可调用的AI技能。该模型能处理全书逻辑,生成的技能保留了原书的框架和原则。X:@AYi_AInotes ↗

21. 构建每周千美元预算上限的智能体教程

视频教程展示了如何构建一个每周预算上限为1000美元的智能体,并介绍了包含模型拒绝列表、数据保留等功能的可堆叠护栏架构,该架构为AI流量提供集中式安全与治理。X:@OpenRouter ↗

22. Google AI 展示并行子智能体自动整理文件

Google AI展示了其并行子智能体技术,能够自动对数百个营销资产进行分类和重命名,从而消除手动文件管理,实现从杂乱到清晰的整理过程。X:@googleaidevs ↗

23. 云端模型如何落地物理世界?招商局狮子山人工智能实验室用LiOS打通具身智能全链路

招商局狮子山人工智能实验室的LiOS系统,探讨了如何将云端AI模型落地到物理世界,以解决复杂家庭环境中柔性物体操作等具身智能挑战,打通从仿真到多形态真机的全链路。量子位 ↗

行业与公司

24. Anthropic 保密向 SEC 提交 S-1 草案

Anthropic已向美国证券交易委员会(SEC)保密提交S-1草案,计划进行首次公开募股(IPO)。IPO的具体细节(股数和价格)尚未确定,将取决于市场条件。公司近期估值达9650亿美元。Anthropic ↗

25. 智谱:建议 A 股发行并在科创板上市

智谱计划申请发行A股并在科创板上市,拟发行股份占总股本的2%至8%,预计全部为新股。募集资金将用于AI通用基座大模型、MaaS平台及补充流动资金。公司拟将英文名称变更为Z.AI Co., Ltd.。IT之家 ↗

26. Alphabet将通过发行股票筹集800亿美元用于AI支出计划

Alphabet正通过发行股票等方式筹集高达800亿美元资金,其中包括与伯克希尔·哈撒韦的投资协议,以资助其庞大的AI基础设施与发展计划。Bloomberg ↗

27. 佛罗里达州起诉OpenAI与Sam Altman:涉多起ChatGPT相关谋杀案

佛罗里达州总检察长对OpenAI及其CEO Sam Altman提起诉讼,指控其对人命“完全漠视”,案件与多起涉及ChatGPT的谋杀事件相关。arstechnica.com ↗

28. 王兴:美团 AI Agent“小美”与腾讯元宝即将深度合作,用户订单无缝连接

美团CEO王兴在财报会上透露,其AI Agent“小美”将与腾讯元宝深度合作,实现本地服务需求的无缝连接。他强调面向智能体的服务(To A)日益重要,美团已将AI助手置于App核心位置。IT之家 ↗

29. 英伟达和台积电将 AI 引入晶圆厂,推动半导体设计与制造发展

英伟达与台积电合作,将人工智能技术引入晶圆厂,旨在革新半导体的设计与制造流程,推动行业技术发展。IT之家 ↗

30. OpenAI在密歇根州启动Stargate 1GW数据中心建设

OpenAI在密歇根州启动名为Stargate的1GW数据中心项目。该项目旨在扩大AI技术可及性、创造就业机会并支持社区发展,是AI基础设施建设的一部分。OpenAI:官网动态 ↗

31. Meta的AI被利用来劫持Instagram账号

Meta的AI聊天机器人被发现存在安全漏洞,黑客可利用该漏洞,通过AI请求关联新邮箱来接管目标用户的Instagram账号,这暴露了AI智能体直接执行账户管理操作的风险。The Verge ↗

32. 清智系企业亮相 BEYOND Expo 2026 并斩获多项大奖

清智系企业(可能指清华大学智能产业研究院相关企业)在BEYOND Expo 2026上亮相,并因其在AI领域的技术创新和商业潜力而斩获多项大奖。量子位 ↗

33. 近2亿美元!VAST完成新一轮融资,正式披露世界模型路线

VAST宣布完成新一轮融资,总额近2亿美元,并正式披露其“世界模型”技术路线。该路线旨在实现“场景永不消失,多人真正同屏”的沉浸式体验。量子位 ↗

34. 德系精工邂逅中国智慧 全新奥迪Q5L现已登陆全国门店

全新奥迪Q5L车型现已在中国市场正式上市,该车型融合了德国精工设计与中国本土化智慧,目前已登陆全国各经销商门店。量子位 ↗

35. OpenAI重返机器人赛道!四大核心岗位开招

OpenAI正在重新进入机器人领域,并已开始招聘四个核心岗位。相关职位的年薪超过200万美元,表明其在该领域投入的决心。量子位 ↗

论文与研究

36. 微软研究聚焦:智能体评估与价值对齐

微软研究聚焦于大规模评估智能体行为,并论证代码库在评估中优于文档。研究同时邀请全球研究人员共同解决AI智能体的价值对齐问题。X:@MSFTResearch ↗

37. BadHost Vulnerability Exposes AI Agents, Evaluators, and LLM Gateways

BadHost是Python网络框架Starlette中的一个高危认证绕过漏洞,该漏洞可能影响AI智能体、评估工具和LLM网关的安全。攻击者可利用畸形的HTTP Host头进行攻击。InfoQ AI ↗

38. 材料版AlphaFold来了!40个工业任务全方位SOTA,AI4S迎来行业大突破

一个被称为“材料版AlphaFold”的AI模型发布,在40个工业相关任务上达到最先进水平(SOTA)。该模型通过叠加大型语言模型的训练,使材料AI初步具备了“物理直觉”,标志着AI for Science在材料领域的重要突破。量子位 ↗

人物与花絮

39. Sam Altman强调AI发展应以人为本

Sam Altman表示,AI不应追求脱离人类需求的目标,人类必须始终处于AI发展的中心。他批判了AI将摧毁工作的言论,并指出行业需更好地解释人类如何在AI时代保持控制权和充实生活。X:@rohanpaul_ai ↗

观点与教程

40. 开源与闭源模型在不同的增长曲线上

开源与闭源AI模型正沿着不同路径发展。闭源模型通过在特定场景下提供更高的边际智能创造价值,而开源模型则在其他维度寻找增长点,两者形成差异化竞争。interconnects.ai ↗

41. Article: The AI Productivity Paradox in Test Automation: Moving Beyond Structura

文章探讨了AI生产力悖论:AI会放大其所依赖的抽象层级。如果底层抽象结构脆弱,AI就会放大这种脆弱性。文章指出,要构建可靠的AI测试自动化,必须超越结构脆弱的抽象层。InfoQ AI ↗

42. 老黄的Token经济学翻车了!微软亚马逊通通跳车

据报道,以英伟达CEO黄仁勋所倡导的“Token经济学”为代表的AI算力热潮正在降温,微软和亚马逊等科技巨头可能正在调整其相关的投资策略。量子位 ↗

43. Token贵只因你喂给模型的垃圾太多了丨@亚马逊王晓野AIGC2026

亚马逊专家王晓野在AIGC2026上指出,AI模型运行成本高的原因在于输入了过多低质量数据(“垃圾”)。他认为,构建AI应用Demo并不难,难的是使其在企业生产环境中稳定运行。量子位 ↗

总结

强信号

  • Meta AI聊天机器人暴露账户接管漏洞 Meta的AI功能被黑客利用,通过请求关联新邮箱来劫持Instagram账号。这直接暴露了让AI智能体执行敏感账户操作的极高安全风险,敲响了警钟。

  • 开源与闭源模型走上不同增长路径 分析指出,闭源模型通过在特定场景提供更高边际智能来创造价值,而开源模型则在其他维度(如成本、可定制性)寻找增长点。这标志着行业进入差异化竞争阶段。

  • 云端大模型开始接入真实物理世界 招商局实验室的LiOS系统展示了如何将云端AI模型落地到机器人等物理设备,解决柔性物体操作等难题。这标志着具身智能正从仿真向真实工业场景的全链路贯通迈出关键一步。

中信号

  • “一句话生成业务”成为产品新卖点 Replit允许用户用单个提示词免费构建包含网站、应用和支付工具的完整业务雏形。这显示AI编程工具正从辅助写代码,快速升级为自动化创建可运行的商业原型。

  • 主流应用开始优化深度内容创作体验 ChatGPT新增长文编辑与保存功能,支持在全屏模式下撰写并保存长篇文章。这表明顶级应用正超越聊天对话,向专业内容工作台演进。

待验证

  • “全球首个全模态API”宣布无限期免费 某未具名的全球顶级AI实验室宣布此举。在商业模型普遍收费的当下,如此激进的策略动机和长期可持续性存疑,需观察其具体限制条件和后续动作。

  • “Token经济学”面临巨头策略调整的质疑 有观点认为英伟达CEO黄仁勋倡导的AI算力“Token经济学”热潮正在降温,微软、亚马逊等巨头可能调整相关投资。这更像是对前期过度投入的反思,是否构成趋势转折还需更多证据。