引言
今日AI领域聚焦智能体搜索、本地推理加速与超应用转型,多款模型与工具发布,平台生态加速演进。
模型与能力
1. Harness-1:基于强化学习训练的有状态搜索20B检索子智能体
UIUC与Chroma联合推出Harness-1(20B参数检索子智能体),基于强化学习在有状态搜索框架中训练,通过策略决定搜索、筛选、验证和停止。在8个基准上平均curated recall为0.730,比次优开源智能体高11.4%,仅落后Opus-4.6。模型与代码已开源。MarkTechPost(RSS) ↗
2. Google LiteRT-LM通过Gemma 4多Token预测将本地推理速度提升2.2倍
LiteRT-LM原生支持Gemma 4的MTP草稿器,推理速度提升至2.2倍,并扩展支持Swift和JavaScript API。InfoQ AI ↗
产品与应用
3. NVIDIA 与 KRAFTON、NC、T1 在韩国庆祝 RTX Spark 发布
NVIDIA在韩国发布RTX Spark超芯片,集成30年技术,支持1440p/100fps游戏及DLSS 4.5。KRAFTON、NC和Riot Games将适配。CEO Jensen Huang与Faker亮相并演示。NVIDIA AI Blog ↗
4. Opus 4.8 缓存命中率与有效价格可实时查看
OpenRouter新增Pricing标签,可实时查看不同模型提供商的缓存命中率和有效价格,包括Opus 4.8。X:OpenRouter (@OpenRouter) ↗
5. OpenAI 仍推进超级应用计划
OpenAI高级员工表示“聊天已死”,公司仍在推进超级应用计划。TechCrunch:AI(RSS) ↗
6. ChatGPT 将转型为超级应用/Agent平台
OpenAI正筹备ChatGPT最大改版,从聊天机器人转向超级应用/Agent平台,整合Codex、图像生成及第三方应用。高管称“聊天已死”,目标成为跨平台个人AI助手。改版预计数周内上线。X:宝玉 (@dotey) ↗
7. Notion因Opus模型服务不稳定暂时禁用所有Anthropic模型引发争议
Notion因Opus 4.7/4.8模型“degraded performance”禁用所有Anthropic模型,后澄清为服务中断而非模型降智,现已恢复。X:NotionStatus (@NotionStatus) ↗
8. 剪映宣布将首发Seedance 2.0系列新模型
剪映预告15日首发上线Seedance 2.0,生成速度更快、价格更低,首发期有折扣。xiaohongshu.com ↗
9. 教你用AI一节课收17万,华尔街精英排着队付费
花旗、美银都是客户,AI培训课程深受华尔街欢迎。量子位 ↗
开发与基础设施
10. Her · हेर — Claude Code 会话分析工具
Her是专为Claude Code设计的会话分析工具,可上传.jsonl文件,用自然语言重建交互,标记高风险操作,展示token消耗、工具、MCP服务器等,并结合最佳实践给出改进建议。内置问答功能,不调用第三方API,使用Nemotron-Mini-4B-Instruct模型在Hugging Face ZeroGPU上运行。Hugging Face:Blog(RSS) ↗
11. Symbolica 2.0:适用于Python和Rust的可编程符号系统
Symbolica 2.0发布,支持Python和Rust,在Hacker News上获得100热度。Hacker News 热门(buzzing.cc 中文翻译) ↗
12. Codex负责人宣布100天每日评选计划,入选者获月度10倍用量
Codex负责人Tibo宣布未来100天每日评选优秀用户,给予一个月10倍用量上限,探索Codex能力边界。X:thsottiaux (@thsottiaux) ↗
13. 5分钟AI长视频不翻车!国产开源框架杀到全球第一梯队
实现高一致性、低延迟、实时超分,全面堆料。量子位 ↗
14. Claude Code新增Dynamic Workflows用于并行Agent协调
Anthropic为Claude Code引入Dynamic Workflows,可在单个工作流中协调大量AI代理,动态创建编排脚本、拆分子任务、并行运行并验证结果。InfoQ AI ↗
15. Cloudflare发现ClickHouse查询规划瓶颈
Cloudflare将计费管道慢速归因于ClickHouse查询规划阶段的争用,通过修补将排他锁换为共享锁,移除每查询的parts列表副本并改进part过滤。InfoQ AI ↗
16. Dropbox推出Nova:大规模运行AI编码代理的内部平台
Dropbox发布Nova内部平台,用于编排和运行AI编码代理,融入公司工程工作流。InfoQ AI ↗
17. DuckDB Quack:基于HTTP的客户端/服务器协议,支持多用户分析
DuckDB宣布Quack远程协议,允许多个实例通过网络连接同一数据库,为本地嵌入式数据库引入客户端-服务器能力。InfoQ AI ↗
18. ExtendDB:开源Amazon DynamoDB兼容适配器,支持可插拔存储后端
AWS宣布ExtendDB,一个DynamoDB兼容适配器,允许使用DynamoDB API但切换不同存储后端(初始支持PostgreSQL),无需修改现有SDK和工具。InfoQ AI ↗
19. Meta如何重建PB级数据摄取以提升可靠性
Meta迁移每天传输数PB MySQL社交图数据的数据摄取平台,使用反向影子测试和持续校验和监控实现零停机。InfoQ AI ↗
20. 导致Spark在Kubernetes上OOM失败的两个错误配置
将Spark迁移到Azure Kubernetes Service后,两个设置交互破坏:spark.kubernetes.local.dirs.tmpfs=true使shuffle spill使用RAM,硬podAffinity规则强制所有executor到同一节点,导致重复OOM。InfoQ AI ↗
21. 平台团队赋能AI:LinkedIn的MCP/多智能体工具
LinkedIn的Karthik Ramgopal和Prince Valluri讨论将AI作为大规模工程执行模型,通过构建编排、结构化上下文和安全工具(如MCP)的平台抽象来超越碎片化实现。InfoQ AI ↗
公司与资本
22. 苹果秘密会议后决定认真对待AI
苹果在内部秘密会议后将AI作为核心战略,相关进展预计在WWDC 2026公布。Bloomberg:Technology(RSS) ↗
23. 马斯克39页SpaceX计划:人类史上最伟大的PPT
SpaceX启动人类历史上最大规模的IPO招股。量子位 ↗
24. 港股鞋王千百度,一夜完成AI数据公司转型
形成“鞋履+人工智能数据”双主业。量子位 ↗
25. Google I/O:AI驱动科学的路径正在转变
Google DeepMind CEO Demis Hassabis在I/O主题演讲中称“我们正站在奇点的山脚”,展示AI推动科学的新方向。MIT科技评论AI ↗
政策与安全
26. 特朗普政府与OpenAI讨论通过公共财富基金入股AI初创公司
据FT,特朗普政府与OpenAI探讨通过公共财富基金让政府入股AI初创公司。方案为企业捐赠股权至基金,收益返还公民。OpenAI此前已提出此概念。X:Rohan Paul (@rohanpaul_ai) ↗
27. BadHost漏洞暴露AI代理、评估器和LLM网关
BadHost是Python Web框架Starlette中的高严重性认证绕过漏洞(周下载3.25亿),攻击者利用畸形HTTP Host头绕过访问控制,访问AI代理基础设施。InfoQ AI ↗
28. Arm开源Metis:超越传统SAST的AI安全框架
Arm开源Metis,一种通过语义推理自主发现复杂软件漏洞的AI安全框架,提供自然语言解释。InfoQ AI ↗
29. 保护AI堆栈:从模型到生产(文章系列)
该系列探讨如何通过分层防御、稳健MLOps和集成治理,从脆弱原型转向弹性系统。InfoQ AI ↗
30. Meta黑客事件:AI客服代理被利用窃取Instagram账号
攻击者利用Meta的AI客服代理,通过要求链接受控邮箱来窃取账号,包括闯入闲置的奥巴马白宫账号。MIT科技评论AI ↗
31. 教皇通谕《崇高人性》为个人应对AI时代提供模板
教皇利奥十四世发布关于人工智能的通谕,强调“技术从不中立”,呼吁科技界和政策制定者以勇气和团结应对AI变革。MIT科技评论AI ↗
32. 法院如何应对AI生成诉讼的洪流
科罗拉多州联邦治安法官Maritza Braswell每日审阅大量无律师当事人提交的AI生成文件,面临工作量激增挑战。MIT科技评论AI ↗
论文与研究
33. 今年CVPR看点是广东:何恺明再获至高大奖,广工大打破大厂名校垄断
广东上大分!量子位 ↗
观点与教程
34. Harness工程:在智能体优先世界中运用Codex
Harness工程分享使用OpenAI Codex的实践文章,发布于openai.com,在Hacker News上获得102热度。Hacker News 热门(buzzing.cc 中文翻译) ↗
35. 北海道农民用ChatGPT和Codex的8个真实AI用法
日本农民富安弘毅利用ChatGPT和Codex解决农场实际问题,包括病害识别、卫星监测、远程控制、数据库管理等8个用法,认为AI让自动化低成本可及。X:阿易 AI Notes (@AYi_AInotes) ↗
36. 对比GPT-5.5与Opus 4.8的设计效果
宝玉对比认为Opus 4.8设计效果远优于GPT-5.5,使用baoyu-design Skill生成HTML并交互,推荐搭配Opus 4.8。X:宝玉 (@dotey) ↗
37. Slop、生产力与AI驱动世界进展甚微
Gary Marcus引用金融时报图表,认为其精准表达了AI进展缓慢的观点。Gary Marcus:The Road to AI We Can Trust(RSS) ↗
38. Hinton吹哨了:AI已经有意识!
人类得接受自己不再是唯一的智能生命体。量子位 ↗
39. 为什么仅靠向量搜索不够:RAG的混合检索
文章讨论纯向量搜索RAG管道的局限,并介绍使用RRF(结合BM25和向量结果)的omni-search应用如何增强搜索方案。InfoQ AI ↗
40. 大模型发展三年半,AI圈终于等来了一场“不要大厂,只赌脑洞”的比赛
观众投币决定前十名。量子位 ↗
41. 在Agentic AI时代重新思考组织设计
85%的组织希望三年内实现代理化,但76%认为当前运营和基础设施无法支撑,存在人员、流程、工作流方面的准备不足。MIT科技评论AI ↗
42. 测试自动化中的AI生产力悖论:从结构验证转向感知与意图
文章指出AI放大其所构建的抽象层脆弱性,主张建立基于感知和意图的新测试范式,取代以DOM为中心的抽象。InfoQ AI ↗
43. 选择你的AI Copilot:最大化开发者生产力
Sepehr Khosravi评估Cursor和Claude Code等工具,讲解上下文工程、自定义规则和MCP集成等技巧,并分享平衡AI采用与代码质量的框架。InfoQ AI ↗
44. AI炒作指数:毕业季AI遭嘘声
前谷歌CEO Eric Schmidt在亚利桑那大学毕业典礼上呼吁学生塑造AI,遭现场一片嘘声。MIT科技评论AI ↗
45. 对AI失业恐慌的现实检验
尽管科技公司裁员不断,但整体就业稳定,AI尚未导致大规模失业,白领岗位并未消失。MIT科技评论AI ↗
46. 小企业如何利用AI
本文来自MIT科技评论系列通讯,介绍小企业如何在会计、设计、市场研究等领域应用LLM。MIT科技评论AI ↗
47. 是时候应对初级工作面临的潜在危机了
AI尚未造成大规模失业,但可能悄然削弱职业阶梯的第一级——初级岗位,这一变化值得警惕。MIT科技评论AI ↗
48. 用Agentic AI重新人性化全球医疗
全球医疗系统因长期资金不足、人员短缺和老龄化需求激增而压力加剧,AI代理有望改善碎片化护理和员工倦怠。MIT科技评论AI ↗
人物与动态
49. OpenAI定制芯片核心成员Clive Chan跳槽至Anthropic
OpenAI定制芯片项目员工Clive Chan离职,本周加入Anthropic,此前参与与Broadcom合作项目。X:itsclivetime (@itsclivetime) ↗
50. OpenAI芯片核心叛逃Anthropic!就在量产前夜
为OpenAI从零造出第一颗芯片的人,转投Anthropic。量子位 ↗
51. 有余凯不投的地平线离职创业员工吗?
地平线“放任”人才外流的反常操作,引发格局猜测。量子位 ↗
52. 马斯克是SpaceX面子,她才是里子
造火箭的正在批量造巨富。量子位 ↗
今日脉络
-
模型能力突破:强化学习搜索与本地推理加速 Harness-1 基于强化学习的有状态搜索检索子智能体在8个基准上表现领先;LiteRT-LM 通过多 Token 预测将本地推理速度提升 2.2 倍。
-
产品应用转向:聊天消亡与超级应用崛起 OpenAI 高管称“聊天已死”,ChatGPT 将转型为超级应用/Agent 平台;剪映预告首发 Seedance 2.0 系列新模型。
-
开发基础设施:编码代理与数据平台升级 Claude Code 引入 Dynamic Workflows 协调并行 Agent;Dropbox 发布 Nova 平台运行 AI 编码代理;DuckDB 推出 Quack 远程协议支持多用户分析。
总结
智能体能力与推理效率持续提升,产品形态从聊天向平台化演进,开发工具链同步升级。关注后续超级应用落地与基础设施生态竞争。
评论 (0)
发表评论
请先登录后发表评论