引言
今日AI日报覆盖人形机器人通用小脑突破、Agent安全与部署新进展、多款开源工具发布及重要人物动向,展现AI在通用智能与工程实践上的双重跃迁。
模型与能力
1. 全球首个人形机器人通用小脑,2万小时数据实现零样本泛化
基于全球最大规模2万小时人类动作数据训练的人形机器人通用小脑,实现零样本泛化,标志进入“GPT时代”。量子位 ↗
产品与应用
2. Claude Code v2.1.183发布,增强自动模式安全性
Claude Code v2.1.183增强自动模式安全性,阻止未请求的破坏性命令;修复thinking块400错误、子智能体WebSearch空结果等问题。Claude Code:GitHub Releases(RSS) ↗
3. Humanize PPT v0.9:开源演讲专用PPT Skill
Humanize PPT v0.9是一款专为演讲场景设计的开源PPT Skill,基于AST逻辑重排大纲,支持预览、质检自动修复、演讲模式,已开源。公众号:卡尔的AI沃茨 ↗
4. GPT实现AI药物全自动研发?
AI在药物研发领域取得新进展,GPT推动全自动研发流程。量子位 ↗
5. 梦境输入AI,生成互动体验
一款新AI工具可将用户梦境转化为可交互场景,被称为创作者的终极玩具。量子位 ↗
开发与基础设施
6. Elasticsearch持久化代理内存层:召回率0.89
Agent Builder正式发布,基于Elasticsearch构建持久化内存层,记忆分为情景、语义、程序三类,分别索引。使用BM25与Jina v5稠密向量的RRF融合,交叉编码器重排序。在168道QA评估中R@10平均0.89,零跨租户泄漏。支持MCP协议,已开源。Hacker News 热门(buzzing.cc 中文翻译) ↗
7. NVIDIA Research发布SpatialClaw免训练空间推理框架
NVIDIA Research发布SpatialClaw,通过代码作为动作接口调用感知工具,解决VLM在3D空间判断的弱点,平均准确率59.9%,支持多种骨干模型。MarkTechPost(RSS) ↗
8. Cloudflare为AI智能体推出临时账户
Cloudflare在Workers上推出临时账户,允许AI智能体直接运行wrangler deploy --temporary,快速获取实时Worker,简化部署流程。Cloudflare Blog ↗
9. 阿里开源向量数据库Zvec,黄碧薇提出因果AI第四代范式
阿里开源内部向量数据库Zvec,对标Pinecone,支持十亿向量毫秒级检索,新增原生全文混合搜索。UCSD黄碧薇教授提出AI四代范式,其创立的Aether AI完成首轮融资。X:阿易 AI Notes (@AYi_AInotes) ↗
10. Azure Functions Ships Serverless Agents Runtime at Build 2026
Azure Functions shipped a serverless agents runtime in public preview at Build 2026. Agents are defined in .agent.md markdown files with YAML triggers, MCP server access, 1,400+ connectors, and sandboxed execution. The Functions team confirmed to InfoQ that the runtime adds no cold start overhead and no billing premium beyond standard Flex Consumption. By Steef-Jan Wiggers。InfoQ AI ↗
11. CircleCI推出Chunk Sidecars,将CI验证集成到AI编码工作流
CircleCI发布Chunk Sidecars功能,使AI编码代理在内部开发循环中直接获得CI验证。InfoQ AI ↗
12. Windows Platform Security and the Race to Secure AI Agents
In a new Windows Developer Blog post titled "Windows platform security for AI agents", Microsoft positions Windows as the trustworthy operating system for autonomous agents and introduces the Microsoft Execution Containers (MXC) SDK as the core of that strategy. The post argues that containment, identity and manageability must be built into the operating system. By Matt Saunders。InfoQ AI ↗
公司与资本
13. Figure机器人数量首次超过人类员工
Figure公司宣布其机器人数量已超过人类员工数量,标志从理论到实践的跨越。X:Rohan Paul (@rohanpaul_ai) ↗
14. A startup claims it broke through a bottleneck that’s holding back LLMs
Miami-based AI startup Subquadratic came out of stealth mode last month with a huge claim. It announced that it had solved a mathematical bottleneck that had been holding back large language models for almost a decade. The details were thin, and many people were unconvinced. But Subquadratic has started to bring the receipts, sharing the…。MIT科技评论AI ↗
政策与安全
15. JAWBONE Act:打击政府施压平台审查言论的新法案
参议员提出两党法案JAWBONE Act,为受政府胁迫的AI及互联网服务商创建诉讼权,并建立透明度体系。EFF支持并举例政府施压案例。Hacker News 热门(buzzing.cc 中文翻译) ↗
论文与研究
16. DeepSeek研究员开源AutoResearch,实现AI自主RL研究闭环
DeepSeek研究员Deli Chen开源AutoResearch协议并发布Self-play综述论文。AI智能体在285B模型上完全自主完成RL研究闭环,零人工干预。X:阿易 AI Notes (@AYi_AInotes) ↗
观点与教程
17. AI中心的数据黑洞
智能的样本效率定义vs当前AI靠数据分布和算力扩张;强化学习本质是合成数据生成;数据行业年收入数十亿美元;开源模型仅落后前沿闭源4个月因可蒸馏;人类一生约2亿token vs前沿模型训练几十到百T token,效率差距巨大。Dwarkesh Patel:Podcast & Blog(RSS) ↗
18. OpenRouter vs LiteLLM:LLM网关选型指南
OpenRouter是托管在Cloudflare边缘的LLM网关,收取5.5%平台费,支持70+提供商和自动故障转移;LiteLLM是自部署代理(Docker/PostgreSQL/Redis),免费开源但需基础设施成本。当月支出超$3,600-$9,100时自托管更划算。两者可串联。OpenRouter:Announcements(RSS) ↗
19. Salesforce CodeGen教程:生成、验证并重排序Python函数(含单元测试与安全检查)
基于Salesforce CodeGen的端到端代码生成工作流,从HuggingFace加载模型(350M、2B、codegen2-1B、codegen25-7b等),通过自然语言提示生成Python函数,进行语法检查、静态安全检查、单元测试验证、best-of-N重排序、多步合成等。MarkTechPost(RSS) ↗
20. /youtube-notetaker:将YT视频转为Artifacts
介绍如何使用 /youtube-notetaker 技能从 YT 视频生成 Artifacts,捕获幻灯片、笔记、转录内容等。X:Elvis Saravia (@omarsar0, DAIR.AI) ↗
21. baoyu-design Skill迭代:修复导出问题并支持AI配图导出PPTX
宝玉分享baoyu-design Skill迭代过程:发现导出样式问题,通过Agent分析修复;该Skill支持AI配图并导出为PPTX,形成用户反馈驱动的迭代循环。X:宝玉 (@dotey) ↗
人物与动态
22. AlphaFold负责人John Jumper离开DeepMind加入Anthropic
AlphaFold团队负责人John Jumper宣布离开Google DeepMind,将加入Anthropic。DeepMind CEO表示其工作改变了世界。X:Demis Hassabis (@demishassabis) ↗
23. OpenAI Bonnie Xu:用AI Agent理解数据——Kepler内部数据分析代理
Bonnie Xu介绍Kepler,一个内部AI数据分析代理,可查询600+PB数据,使用MCP、自动代码爬取和RAG克服上下文窗口限制,并利用作用域语义记忆和学习,AST-based LLM评分构建评估流水线。InfoQ AI ↗
今日脉络
-
人形机器人通用小脑迎来里程碑 全球首个人形机器人通用小脑基于2万小时人类动作数据训练,实现零样本泛化,被评价为进入GPT时代。
-
Agent安全性与部署工具密集更新 Claude Code增强自动模式安全性,Microsoft推出Windows Agent安全容器SDK,Elasticsearch发布基于MCP协议的Agent持久化内存层。
-
开源生态与开发基础设施加速 阿里开源向量数据库Zvec,Azure Functions推出Serverless Agents Runtime,Humanize PPT v0.9开源演讲Skill。
-
重要人物加入Anthropic AlphaFold负责人John Jumper离开DeepMind加入Anthropic,DeepMind CEO表示其工作改变了世界。
总结
人形机器人通用小脑的零样本泛化与Figure机器人数量超越人类员工,标志具身智能从验证走向规模落地。同时,安全容器、持久化记忆层等Agent基础设施快速成熟,开源向量数据库与Serverless运行时降低门槛。人物流动暗示学界与产业界对前沿AI人才争夺加剧。
评论 (0)
发表评论
请先登录后发表评论