引言
今日AI日报涵盖模型迭代、产品落地、产业动态等核心板块,聚焦开源大模型、具身智能、开发工具及行业合作最新进展,快速梳理当日要点。
模型与能力
1. NVIDIA发布开放权重扩散语言模型Nemotron-Labs-TwoTower
NVIDIA发布Nemotron-Labs-TwoTower扩散语言模型,基于冻结自回归骨干Nemotron-3-Nano-30B-A3B,采用双塔架构,2×H100上BF16评估保留98.7%AR基线质量,生成吞吐量提升2.42倍,总参数约60B,支持扩散、模拟AR和AR三种解码模式。MarkTechPost(RSS) ↗
2. OpenAI论文披露GPT-5.6三个Pro变体,替代原有单一Pro模式
OpenAI最新论文首次披露GPT-5.6的三个Pro变体:Luna Pro、Terra Pro、Sol Pro,替代此前单一Pro模式。其中Sol Pro在基因组学基准中以31.5%的通过率位列60个测试模型第一,各Pro版本相对标准版的提升幅度逐级递减,论文未披露Pro版本的token消耗量,也未说明该分层是否会在ChatGPT中上线。The Decoder:AI News(RSS) ↗
3. 美团发布开源万亿参数大模型LongCat-2.0
美团6月30日发布开源万亿参数大模型LongCat-2.0,总参数1.6T,平均激活约48B,原生支持1M超长上下文,在五万卡国产算力集群完成全流程训练,采用LSA稀疏注意力、ScMoE等架构,SWE-bench Pro评测得分59.5,预览版已上线OpenRouter,月调用量跻身全球前三。公众号:龙猫LongCat(美团) ↗
4. 联汇发布VLX:全球首个面向物理世界的端侧流式多模态模型
该模型被视为物理世界AI发展的下一步方向。量子位 ↗
5. 英伟达开源机器人技能库,Jim Fan称具身智能范式更新
英伟达发布开源机器人技能库,配套全新持续学习范式,推动具身智能能力升级。量子位 ↗
产品与应用
6. Cloudflare推出Monetization Gateway:支持通过x402协议为资源收费
Cloudflare开放Monetization Gateway候补名单,可对网页、数据集、API或MCP工具收费,费用通过x402开放协议以稳定币结算,用户无需自建支付栈。Cloudflare Blog ↗
7. Google 2026年6月AI更新:推出Gemini 3.5 Live Translate实时语音翻译
Google于6月发布多项AI更新,目前披露的更新包括推出Gemini 3.5 Live Translate实时语音翻译功能。Google Blog:AI(RSS) ↗
8. Google举办AI教育峰会,共议AI课堂落地路径
Google与New York Jobs CEO Council、Urban Assembly联合举办AI教育峰会,150名教育及行业领袖参与,通过实践环节探索Google AI mode、NotebookLM在提升AI素养方面的应用。与会者共识为技术创新需与学校合作,坚守隐私与公平访问原则。Google Blog:AI(RSS) ↗
9. xAI发布Voice Agent Builder测试版
xAI推出Voice Agent Builder测试版,是基于Grok Voice的无代码语音智能体创建平台,集成电话、知识检索、MCP、Guardrails等功能,支持连接SIP号码、API和WebSocket,Grok Voice Think Fast 1.0在τ-voice Bench得分67.3%领先同类模型,定价为每分钟音频0.05美元、电话费0.01美元,提供80+种语音及声音克隆,每个账户赠免费电话号码。xAI:News(网页) ↗
10. Cloudflare推出精细化AI流量管理功能
Cloudflare推出全新AI流量管理选项,可区分搜索爬虫、AI智能体爬虫和训练爬虫,取代一刀切的屏蔽方式,同时新增广告变现页面保护能力。Cloudflare Blog ↗
11. OceanBase推出湖库一体架构,重新定义AI数据库
OceanBase实现一套技术栈支持离在线数据统一处理,重构AI数据库能力边界。量子位 ↗
12. 金融AI业务竞赛开赛,四道真题考验从业者能力
本次金融AI武道大会设置四道业务真题,出题方表示最优解难以预测,业务sense是决定能力上限的核心因素。量子位 ↗
开发与基础设施
13. Claude Code v2.1.198版本发布
Claude Code发布v2.1.198更新,Claude in Chrome全面可用,新增后台智能体通知、/dataviz技能,Gateway新增AWS上的Claude Platform上游提供商,后台智能体可自动提交推送代码并创建草稿PR,修复网络断开、后台任务卡顿、API错误导致智能体失败等问题。Claude Code:GitHub Releases(RSS) ↗
14. 智谱推出GLM-5.2官方开发环境ZCode
智谱推出GLM-5.2官方开发环境ZCode,GLM Coding Plan订阅用户可获得1.5倍使用配额,支持BYOK适配现有订阅和API,适用于macOS、Windows、Linux系统。X:智谱 Z.ai (@Zai_org) ↗
15. Genkit推出Agents API简化智能体全栈开发
开源框架Genkit推出Agents API,将消息历史、工具循环和流式传输封装为单一接口,支持状态持久化、历史分支、长时间运行任务及多智能体协调,已集成Genkit Developer UI,目前以TypeScript和Go预览版发布。Google Developers Blog(RSS) ↗
16. Google Cloud Workbench Notebooks扩展上线:VS Code可直连云端Jupyter环境
Google Cloud Workbench Notebooks扩展正式发布,开发者可在VS Code中直接连接云端Jupyter环境,无需切换上下文即可利用Google Cloud基础设施完成机器学习全流程,该扩展已完全开源,可在GitHub和VS Code Marketplace获取。Google Developers Blog(RSS) ↗
17. Meta公开大规模AI存储架构蓝图
Meta运营数百EB级存储集群,基于Tectonic分层存储层构建BLOB存储架构,以提升GPU利用率与研究迭代速度。新架构解决了传统BLOB存储多层元数据查询延迟高的问题,通过闪存提供可预测的低延迟,支持地理分布GPU间的数据高速注入与跨区移动。Meta Engineering Blog(RSS) ↗
18. OpenSquilla 0.4.0版本发布,AI编程首次实现代码自我验证
OpenSquilla上线数周内GitHub star量已达数千级别,新版本首次让AI写代码具备自我验证能力。量子位 ↗
19. 获卡帕西、李飞飞、辛顿投资的Transformer专用芯片拿下10亿美元订单,已流片
该Transformer专用芯片已成功流片,此前获得卡帕西、李飞飞、辛顿投资,此次签下10亿美元大额订单。量子位 ↗
20. 演讲:Graph RAG:基于知识图谱构建更智能的检索工作流
Cassie Shum 在演讲中探讨了GraphRAG的架构演进,阐释数据基础对高级AI工作流的关键作用。她指出传统向量RAG在全局上下文处理、多跳推理和溯源方面存在不足,并分享了企业构建语义结构化知识图谱的策略,可将原始编排逻辑下沉至数据层。InfoQ AI ↗
21. 演讲:生产级AI背后的基础设施挑战
专家小组探讨了大规模可靠运行AI系统的现实挑战:模型构建难题已解决,但高压下的生产数据库维护仍无成熟方案。他们讨论了决定团队能否平稳扩展的关键架构决策,以及工程负责人当下需要重新思考的方向。InfoQ AI ↗
公司与资本
22. AWS投10亿美元组建驻场工程师团队,协助客户落地AI应用
亚马逊AWS宣布设立新部门,先期投入10亿美元组建前置驻场工程师团队,分批派驻客户企业,每批5-6组工程师驻场45天,协助客户落地人工智能软件与智能体应用。该模式在Palantir、Salesforce等企业已有先例,2023至2025年同类岗位需求增长42倍,新部门员工规模将达数千人,首批客户包括NBA与理光。IT之家(RSS) ↗
23. Meta拟推出Meta Compute云服务,变现过剩AI算力
据Bloomberg报道,Meta计划推出云基础设施业务Meta Compute,对外出售AI计算能力与模型访问权限,直接与AWS、Google Cloud、Azure竞争。Meta已承诺未来几年投入1829亿美元建设AI基础设施,规模如曼哈顿的俄亥俄州数据中心将于今年上线,新业务还将托管包括闭源模型Muse Spark在内的AI模型。TechCrunch:AI(RSS) ↗
24. Runway与Bertelsmann达成创意内容领域合作
Runway宣布与Bertelsmann建立创意合作伙伴关系,双方将在创意内容领域展开合作,具体合作细节暂未披露。Runway:News(网页) ↗
25. 大湾区首个200亿级具身大脑项目落地,自变量两个月连融四轮完成交割
自变量公司两个月内连续完成四轮融资,总规模达200亿元,由四大互联网企业分别领投,将用于大湾区首个具身大脑项目研发。量子位 ↗
26. 硅基流动招股书披露:Token售卖并非稳赚不赔
其招股书显示公司定位为AI推理时代的Token工厂。量子位 ↗
政策与安全
27. Anthropic被曝在Claude Code中植入隐写术代码识别中国用户
Anthropic在Claude Code中嵌入隐写术代码,通过读取本地时区、ANTHROPIC_BASE_URL环境变量与经base64+XOR(密钥91)加密的域名列表比对识别中国用户,识别后修改系统提示词字符作为标记传回服务器,该行为被社区逆向发现后引发争议,破坏用户信任。公众号:数字生命卡兹克 ↗
论文与研究
28. 群核科技3项成果入选ECCV 2026,联合英伟达等探索物理AI仿真平台
群核科技共有3项研究成果入选ECCV 2026,将与英伟达等企业共同推进物理AI前沿技术探索。量子位 ↗
29. 中国初创公司Loop世界模型论文登顶Hugging Face,获周鸿祎、陆奇投资
该论文重写AI反复推演世界运行规律的技术路径,相关成果登顶Hugging Face平台,背后团队已获得周鸿祎、陆奇投资。量子位 ↗
观点与教程
30. Dwarkesh Patel举办AI重大问题征文,三份获奖方案公布
本次征文评选出3位获奖者:第一名Jassi Pannu提议OpenAI基金会投入数十亿美元,通过AI加速自主生物学研发终结空气传播疾病,预计可带来超1万亿美元年GDP增长并消除大流行病风险;第二名Ege Erdil建议AI供应链外国家通过强产权、低资本税、开放监管政策抓住AI增长机遇;第三名Michael Li类比香港地铁商业模式,提出AI实验室可通过收购互补性资产实现盈利。Dwarkesh Patel:Podcast & Blog(RSS) ↗
31. Google官方博客阐述ADK 2.0构建动机与迁移理由
Google官方博客发布文章说明ADK 2.0的核心特性、升级理由及开发者应迁移的原因,该文章发布于ADK 2.0正式上线次日。Google Developers Blog(RSS) ↗
32. 构建AI智能体应优先设计路由以降低成本
构建AI智能体时需优先设计路由层,路由决定每个请求的处理模型,正确路由可使70%-80%的流量运行在免费本地模型或异步推理上,将AI开销降低90%以上。路由分为技能分类器、路由器、模型选择器三层,技能蒸馏后非编码类任务中70%-80%的智能体流量可由本地模型处理。Tomer Tunguz 博客(VC 分析) ↗
33. 内容独立日上线一周年:探讨智能体互联网商业构建路径
内容独立日上线一年后,付费内容动态市场已初步形成;自主AI智能体的兴起正颠覆传统搜索推荐模式,构建可持续的网络经济需配套全新基础设施支撑。Cloudflare Blog ↗
34. 指南:编写可预测AI Skill的方法与实践
mattpocockuk发布的《/writing-great-skills》是编写稳定可预测AI Skill的指南,核心原则包括以过程可预测为目标、区分模型自动触发与用户调用场景、采用三层信息结构实现渐进式披露、明确每步骤完成标准等,同时总结了五种常见失败模式及No-op测试方法。X:邵猛 (@shao__meng) ↗
35. 大模型陷入群体思维定式,这家初创公司正试图打破僵局
文章以互动游戏为例说明:在Claude、ChatGPT、Gemini等主流大模型中输入1-10的随机数请求,多数会返回7,再次请求则大概率返回3、4或8-9,揭示大模型存在群体思维问题,一家初创公司正在尝试解决该缺陷。MIT科技评论AI ↗
今日脉络
-
多模态与具身智能模型密集迭代
NVIDIA发布开放权重扩散语言模型Nemotron-Labs-TwoTower,生成吞吐量提升2.42倍;美团开源万亿参数LongCat-2.0,原生支持1M超长上下文;联汇发布全球首个端侧流式物理世界多模态模型VLX;英伟达开源机器人技能库,推动具身智能范式更新。 -
产品工具落地覆盖多元场景
Cloudflare推出x402协议资源收费网关与AI流量精细化管理功能;Google上线Gemini 3.5 Live Translate实时语音翻译并举办AI教育峰会;xAI发布无代码语音智能体构建平台Voice Agent Builder;OceanBase推出湖库一体架构重构AI数据库能力边界。 -
开发工具升级与产业资本加码
Claude Code v2.1.198版本上线,新增后台智能体自动提交代码功能;智谱发布GLM-5.2官方开发环境ZCode;Genkit推出Agents API简化智能体全栈开发;AWS投10亿美元组建驻场团队协助客户落地AI应用;Meta拟推出Meta Compute云服务变现过剩算力;自变量两个月连融四轮总规模200亿元布局具身大脑项目。
总结
整体来看,今日AI行业在模型能力、产品落地、产业配套三个维度均有实质性进展,开源生态持续繁荣,具身智能、AI编程等细分赛道加速落地,后续可关注各领域技术迭代与商业化落地的实际进展。
评论 (0)
发表评论
请先登录后发表评论