引言

今日AI领域聚焦智能体搜索、本地推理加速与超应用转型,多款模型与工具发布,平台生态加速演进。

模型与能力

1. Harness-1:基于强化学习训练的有状态搜索20B检索子智能体

UIUC与Chroma联合推出Harness-1(20B参数检索子智能体),基于强化学习在有状态搜索框架中训练,通过策略决定搜索、筛选、验证和停止。在8个基准上平均curated recall为0.730,比次优开源智能体高11.4%,仅落后Opus-4.6。模型与代码已开源。MarkTechPost(RSS) ↗

2. Google LiteRT-LM通过Gemma 4多Token预测将本地推理速度提升2.2倍

LiteRT-LM原生支持Gemma 4的MTP草稿器,推理速度提升至2.2倍,并扩展支持Swift和JavaScript API。InfoQ AI ↗

产品与应用

3. NVIDIA 与 KRAFTON、NC、T1 在韩国庆祝 RTX Spark 发布

NVIDIA在韩国发布RTX Spark超芯片,集成30年技术,支持1440p/100fps游戏及DLSS 4.5。KRAFTON、NC和Riot Games将适配。CEO Jensen Huang与Faker亮相并演示。NVIDIA AI Blog ↗

4. Opus 4.8 缓存命中率与有效价格可实时查看

OpenRouter新增Pricing标签,可实时查看不同模型提供商的缓存命中率和有效价格,包括Opus 4.8。X:OpenRouter (@OpenRouter) ↗

5. OpenAI 仍推进超级应用计划

OpenAI高级员工表示“聊天已死”,公司仍在推进超级应用计划。TechCrunch:AI(RSS) ↗

6. ChatGPT 将转型为超级应用/Agent平台

OpenAI正筹备ChatGPT最大改版,从聊天机器人转向超级应用/Agent平台,整合Codex、图像生成及第三方应用。高管称“聊天已死”,目标成为跨平台个人AI助手。改版预计数周内上线。X:宝玉 (@dotey) ↗

7. Notion因Opus模型服务不稳定暂时禁用所有Anthropic模型引发争议

Notion因Opus 4.7/4.8模型“degraded performance”禁用所有Anthropic模型,后澄清为服务中断而非模型降智,现已恢复。X:NotionStatus (@NotionStatus) ↗

8. 剪映宣布将首发Seedance 2.0系列新模型

剪映预告15日首发上线Seedance 2.0,生成速度更快、价格更低,首发期有折扣。xiaohongshu.com ↗

9. 教你用AI一节课收17万,华尔街精英排着队付费

花旗、美银都是客户,AI培训课程深受华尔街欢迎。量子位 ↗

开发与基础设施

10. Her · हेर — Claude Code 会话分析工具

Her是专为Claude Code设计的会话分析工具,可上传.jsonl文件,用自然语言重建交互,标记高风险操作,展示token消耗、工具、MCP服务器等,并结合最佳实践给出改进建议。内置问答功能,不调用第三方API,使用Nemotron-Mini-4B-Instruct模型在Hugging Face ZeroGPU上运行。Hugging Face:Blog(RSS) ↗

11. Symbolica 2.0:适用于Python和Rust的可编程符号系统

Symbolica 2.0发布,支持Python和Rust,在Hacker News上获得100热度。Hacker News 热门(buzzing.cc 中文翻译) ↗

12. Codex负责人宣布100天每日评选计划,入选者获月度10倍用量

Codex负责人Tibo宣布未来100天每日评选优秀用户,给予一个月10倍用量上限,探索Codex能力边界。X:thsottiaux (@thsottiaux) ↗

13. 5分钟AI长视频不翻车!国产开源框架杀到全球第一梯队

实现高一致性、低延迟、实时超分,全面堆料。量子位 ↗

14. Claude Code新增Dynamic Workflows用于并行Agent协调

Anthropic为Claude Code引入Dynamic Workflows,可在单个工作流中协调大量AI代理,动态创建编排脚本、拆分子任务、并行运行并验证结果。InfoQ AI ↗

15. Cloudflare发现ClickHouse查询规划瓶颈

Cloudflare将计费管道慢速归因于ClickHouse查询规划阶段的争用,通过修补将排他锁换为共享锁,移除每查询的parts列表副本并改进part过滤。InfoQ AI ↗

16. Dropbox推出Nova:大规模运行AI编码代理的内部平台

Dropbox发布Nova内部平台,用于编排和运行AI编码代理,融入公司工程工作流。InfoQ AI ↗

17. DuckDB Quack:基于HTTP的客户端/服务器协议,支持多用户分析

DuckDB宣布Quack远程协议,允许多个实例通过网络连接同一数据库,为本地嵌入式数据库引入客户端-服务器能力。InfoQ AI ↗

18. ExtendDB:开源Amazon DynamoDB兼容适配器,支持可插拔存储后端

AWS宣布ExtendDB,一个DynamoDB兼容适配器,允许使用DynamoDB API但切换不同存储后端(初始支持PostgreSQL),无需修改现有SDK和工具。InfoQ AI ↗

19. Meta如何重建PB级数据摄取以提升可靠性

Meta迁移每天传输数PB MySQL社交图数据的数据摄取平台,使用反向影子测试和持续校验和监控实现零停机。InfoQ AI ↗

20. 导致Spark在Kubernetes上OOM失败的两个错误配置

将Spark迁移到Azure Kubernetes Service后,两个设置交互破坏:spark.kubernetes.local.dirs.tmpfs=true使shuffle spill使用RAM,硬podAffinity规则强制所有executor到同一节点,导致重复OOM。InfoQ AI ↗

21. 平台团队赋能AI:LinkedIn的MCP/多智能体工具

LinkedIn的Karthik Ramgopal和Prince Valluri讨论将AI作为大规模工程执行模型,通过构建编排、结构化上下文和安全工具(如MCP)的平台抽象来超越碎片化实现。InfoQ AI ↗

公司与资本

22. 苹果秘密会议后决定认真对待AI

苹果在内部秘密会议后将AI作为核心战略,相关进展预计在WWDC 2026公布。Bloomberg:Technology(RSS) ↗

23. 马斯克39页SpaceX计划:人类史上最伟大的PPT

SpaceX启动人类历史上最大规模的IPO招股。量子位 ↗

24. 港股鞋王千百度,一夜完成AI数据公司转型

形成“鞋履+人工智能数据”双主业。量子位 ↗

25. Google I/O:AI驱动科学的路径正在转变

Google DeepMind CEO Demis Hassabis在I/O主题演讲中称“我们正站在奇点的山脚”,展示AI推动科学的新方向。MIT科技评论AI ↗

政策与安全

26. 特朗普政府与OpenAI讨论通过公共财富基金入股AI初创公司

据FT,特朗普政府与OpenAI探讨通过公共财富基金让政府入股AI初创公司。方案为企业捐赠股权至基金,收益返还公民。OpenAI此前已提出此概念。X:Rohan Paul (@rohanpaul_ai) ↗

27. BadHost漏洞暴露AI代理、评估器和LLM网关

BadHost是Python Web框架Starlette中的高严重性认证绕过漏洞(周下载3.25亿),攻击者利用畸形HTTP Host头绕过访问控制,访问AI代理基础设施。InfoQ AI ↗

28. Arm开源Metis:超越传统SAST的AI安全框架

Arm开源Metis,一种通过语义推理自主发现复杂软件漏洞的AI安全框架,提供自然语言解释。InfoQ AI ↗

29. 保护AI堆栈:从模型到生产(文章系列)

该系列探讨如何通过分层防御、稳健MLOps和集成治理,从脆弱原型转向弹性系统。InfoQ AI ↗

30. Meta黑客事件:AI客服代理被利用窃取Instagram账号

攻击者利用Meta的AI客服代理,通过要求链接受控邮箱来窃取账号,包括闯入闲置的奥巴马白宫账号。MIT科技评论AI ↗

31. 教皇通谕《崇高人性》为个人应对AI时代提供模板

教皇利奥十四世发布关于人工智能的通谕,强调“技术从不中立”,呼吁科技界和政策制定者以勇气和团结应对AI变革。MIT科技评论AI ↗

32. 法院如何应对AI生成诉讼的洪流

科罗拉多州联邦治安法官Maritza Braswell每日审阅大量无律师当事人提交的AI生成文件,面临工作量激增挑战。MIT科技评论AI ↗

论文与研究

33. 今年CVPR看点是广东:何恺明再获至高大奖,广工大打破大厂名校垄断

广东上大分!量子位 ↗

观点与教程

34. Harness工程:在智能体优先世界中运用Codex

Harness工程分享使用OpenAI Codex的实践文章,发布于openai.com,在Hacker News上获得102热度。Hacker News 热门(buzzing.cc 中文翻译) ↗

35. 北海道农民用ChatGPT和Codex的8个真实AI用法

日本农民富安弘毅利用ChatGPT和Codex解决农场实际问题,包括病害识别、卫星监测、远程控制、数据库管理等8个用法,认为AI让自动化低成本可及。X:阿易 AI Notes (@AYi_AInotes) ↗

36. 对比GPT-5.5与Opus 4.8的设计效果

宝玉对比认为Opus 4.8设计效果远优于GPT-5.5,使用baoyu-design Skill生成HTML并交互,推荐搭配Opus 4.8。X:宝玉 (@dotey) ↗

37. Slop、生产力与AI驱动世界进展甚微

Gary Marcus引用金融时报图表,认为其精准表达了AI进展缓慢的观点。Gary Marcus:The Road to AI We Can Trust(RSS) ↗

38. Hinton吹哨了:AI已经有意识!

人类得接受自己不再是唯一的智能生命体。量子位 ↗

39. 为什么仅靠向量搜索不够:RAG的混合检索

文章讨论纯向量搜索RAG管道的局限,并介绍使用RRF(结合BM25和向量结果)的omni-search应用如何增强搜索方案。InfoQ AI ↗

40. 大模型发展三年半,AI圈终于等来了一场“不要大厂,只赌脑洞”的比赛

观众投币决定前十名。量子位 ↗

41. 在Agentic AI时代重新思考组织设计

85%的组织希望三年内实现代理化,但76%认为当前运营和基础设施无法支撑,存在人员、流程、工作流方面的准备不足。MIT科技评论AI ↗

42. 测试自动化中的AI生产力悖论:从结构验证转向感知与意图

文章指出AI放大其所构建的抽象层脆弱性,主张建立基于感知和意图的新测试范式,取代以DOM为中心的抽象。InfoQ AI ↗

43. 选择你的AI Copilot:最大化开发者生产力

Sepehr Khosravi评估Cursor和Claude Code等工具,讲解上下文工程、自定义规则和MCP集成等技巧,并分享平衡AI采用与代码质量的框架。InfoQ AI ↗

44. AI炒作指数:毕业季AI遭嘘声

前谷歌CEO Eric Schmidt在亚利桑那大学毕业典礼上呼吁学生塑造AI,遭现场一片嘘声。MIT科技评论AI ↗

45. 对AI失业恐慌的现实检验

尽管科技公司裁员不断,但整体就业稳定,AI尚未导致大规模失业,白领岗位并未消失。MIT科技评论AI ↗

46. 小企业如何利用AI

本文来自MIT科技评论系列通讯,介绍小企业如何在会计、设计、市场研究等领域应用LLM。MIT科技评论AI ↗

47. 是时候应对初级工作面临的潜在危机了

AI尚未造成大规模失业,但可能悄然削弱职业阶梯的第一级——初级岗位,这一变化值得警惕。MIT科技评论AI ↗

48. 用Agentic AI重新人性化全球医疗

全球医疗系统因长期资金不足、人员短缺和老龄化需求激增而压力加剧,AI代理有望改善碎片化护理和员工倦怠。MIT科技评论AI ↗

人物与动态

49. OpenAI定制芯片核心成员Clive Chan跳槽至Anthropic

OpenAI定制芯片项目员工Clive Chan离职,本周加入Anthropic,此前参与与Broadcom合作项目。X:itsclivetime (@itsclivetime) ↗

50. OpenAI芯片核心叛逃Anthropic!就在量产前夜

为OpenAI从零造出第一颗芯片的人,转投Anthropic。量子位 ↗

51. 有余凯不投的地平线离职创业员工吗?

地平线“放任”人才外流的反常操作,引发格局猜测。量子位 ↗

52. 马斯克是SpaceX面子,她才是里子

造火箭的正在批量造巨富。量子位 ↗

今日脉络

  • 模型能力突破:强化学习搜索与本地推理加速 Harness-1 基于强化学习的有状态搜索检索子智能体在8个基准上表现领先;LiteRT-LM 通过多 Token 预测将本地推理速度提升 2.2 倍。

  • 产品应用转向:聊天消亡与超级应用崛起 OpenAI 高管称“聊天已死”,ChatGPT 将转型为超级应用/Agent 平台;剪映预告首发 Seedance 2.0 系列新模型。

  • 开发基础设施:编码代理与数据平台升级 Claude Code 引入 Dynamic Workflows 协调并行 Agent;Dropbox 发布 Nova 平台运行 AI 编码代理;DuckDB 推出 Quack 远程协议支持多用户分析。

总结

智能体能力与推理效率持续提升,产品形态从聊天向平台化演进,开发工具链同步升级。关注后续超级应用落地与基础设施生态竞争。