引言

今日AI领域关注国产大模型突破、应用生态扩展及安全风险。美团1.6万亿参数模型登顶OpenRouter,Cline推出低价订阅,Claude多平台落地,同时词元盗用等新威胁浮现。

模型与能力

1. 美团LongCat Owl Alpha:OpenRouter最流行模型,1.6万亿MoE,国产ASIC训练

美团LongCat的1.6万亿参数MoE模型Owl Alpha成为OpenRouter上最流行模型,累计消耗10万亿tokens,性能达Gemini/Opus 4.6级别。该模型使用35万亿tokens训练,完全在5万块国产ASIC上完成。据官方推文,Owl Alpha上线后每日调用量全球Top3,在Hermes Agent排名#1,Claude Code排名#2,OpenClaw排名#3。该模型即将退役,后续版本待公布。X:Emad Mostaque (@EMostaque) ↗

2. Cline 推出 ClinePass 订阅,首月 1.99 美元起可用 GLM 5.2

Cline 推出 ClinePass 订阅服务,开发者现可在订购该订阅直接使用 GLM 5.2 等一批精选开放权重模型。标准月费 9.99 美元,当前通过命令行注册的用户可享首月 1.99 美元优惠。X:cline (@cline) ↗

3. 社区发现疑似GPT-5.6灰度方法,测试结果存随机性

通过Codex中gpt-5.5模型和xhigh推理可验证,但方法随机。X:hqmank (@hqmank) ↗

4. Claude Code 下版本 Subagents 将默认后台运行,已小范围推出

Claude Code 团队成员 Boris Cherny 称,下个版本将使 subagents 默认后台运行,该特性已向少量用户逐步推出。用户可在 subagents 后台任务执行时继续对话。X:bcherny (@bcherny) ↗

5. 隐空间世界模型问世,打通长时序双向物理因果链

融资2亿美元,登顶具身智能榜单。量子位 ↗

产品与应用

6. Claude 在 Microsoft Foundry 正式可用

从今天起,Claude 模型在 Microsoft Foundry 上正式可用,托管于 Azure 环境,运行在 NVIDIA GB300 GPU 上。首批提供 Claude Opus 4.8 和 Claude Haiku 4.5,通过 Messages API 调用,支持提示缓存和扩展思考。用户可选择推理处理位置,包括美国数据区域,由 Anthropic 负责推理运营。Azure 用户可使用现有身份验证、计费与治理控制,并获得统一账单;符合条件的 Enterprise Agreement 客户可将 Claude 用量计入 Azure 承诺消费。Claude:Blog(网页) ↗

7. OpenClaw 发布原生 iOS 与 Android 应用

OpenClaw 现已登陆 iOS 和 Android 🦞 📱 原生移动应用,终于来了 💬 智能体装进口袋 🔔 频道、任务、回复,随时处理 用你的大拇指,在任何地方运行智能体。 iOS: https://apps.apple.com/us/app/openclaw-ai-that-does-things/id6780396132 Android: https://play.google.com/store/apps/details?id=ai.openclaw.app。X:OpenClaw (@openclaw) ↗

8. 小红书 RedKnot 推理引擎:将 KV Cache 按注意力头拆解实现长文本加速

RedKnot 将 KV Cache 沿注意力头维度拆解,通过头分类稀疏(局部头占 83.4%–96.8%)、稀疏 FFN 和 SegPagedAttention 三个机制统一算法与存储粒度。在 8 卡 H800 上,TTFT 最高加速 1.6–3.54×,单卡并发提升 4.7–7.8×,预填充 FLOPs 削减 67%–79.5%。DeepSeek-V4-Flash 上 128K 上下文 TTFT 加速达 5.16×,KV 传输最多省 6.3×。精度通常不低于稠密 F1 的 95%。公众号:小红书技术(dots.llm) ↗

9. Claude Code v2.1.196 发布

新增组织默认模型支持,未选模型时显示“Org default”。聊天会话可读默认名称,文件附件支持 Cmd/Ctrl-click 定位。安全方面,claude mcp list/get 不再启动通过 .claude/settings.json 自批准的不安全服务器;不受信任工作区显示“Pending approval”。/code-review 合并五个清理查找器,token 用量减少约 25%。终端 UI 跳过空子树遍历减少渲染。流式空闲看门狗默认开启,5 分钟无事件自动中止重试。修复背景对话误删、远程会话自动恢复、MCP OAuth 作用域冲突、Agents 侧边栏焦点丢失等多项问题。Claude Code:GitHub Releases(RSS) ↗

10. EverOS:开源Markdown优先智能体记忆运行时,支持混合检索与自进化技能

EverMind 推出开源智能体记忆运行时 EverOS(Apache 2.0 许可)。它以可编辑的 Markdown 文件为记忆主体,经 SQLite 管理状态、LanceDB 实现混合检索(BM25 关键词 + 向量搜索 + 标量过滤)。每个完成的任务记录为 Case,离线提炼为可复用的 Skill,使记忆随使用自我进化。v1.1.0 新增 Knowledge APIs(支持分类与话题搜索的 Markdown 页面)和 Reflection(跨会话优化 Profile 和 Skill)。据 EverMind 报告,LoCoMo 得分 93.05%,LongMemEval 83.00%,HaluMem 93.04%,p95 检索延…。MarkTechPost(RSS) ↗

11. 从任何地点构建——Cursor for iOS 公测版发布

Cursor 推出 iOS 原生公测版,所有付费计划可用。开发者可在手机上启动始终在线的云端智能体,或远程操控电脑端智能体。支持语音输入、斜杠命令和选择前沿模型。智能体运行后,锁屏 Live Activities 和推送通知实时更新状态,完成或需要输入时提醒。云端智能体在隔离虚拟机中运行,可自动迭代生成合并就绪的 PR,并输出演示、截图和日志。本地与云端智能体支持双向切换。移动端 Composer 2.5 享受 75% 折扣,优惠至 2026 年 7 月 5 日。Cursor Blog ↗

12. 为 Amazon Bedrock 和 Google Cloud 推出的 Claude apps gateway

Anthropic 今日推出 Claude apps gateway,一个自托管控制平面,让企业能在 Amazon Bedrock 和 Google Cloud 上运行 Claude Code。它作为单个无状态容器部署于 Linux,后端使用 PostgreSQL,提供企业级 SSO 登录(通过 OIDC 对接 Google Workspace、Microsoft Entra ID、Okta 等)、集中策略管理、角色权限、路由(支持故障转移)以及按日/周/月、按组织/群组/用户的消费上限。遥测数据通过 OTLP 发送至用户配置的收集器。gateway 不会向 Anthropic 发送推理流量或使用数据(除非配置使用 Claude A…。Claude:Blog(网页) ↗

13. Herdr:驻留在终端中的AI智能体多路复用器

Herdr是一个驻留在终端中的AI智能体多路复用器,允许用户在单一终端界面内管理和切换多个AI智能体会话。Hacker News 热门(buzzing.cc 中文翻译) ↗

14. OpenAI预告Codex新硬件,与Work Louder合作推出宏键盘

7月15日发布,方形宏键盘专为Codex打造。X:OpenAI Developers (@OpenAIDevs) ↗

15. Cursor发布iOS应用,支持手机启动和远程控制编程Agent

Cursor正式发布iOS应用,并向所有付费用户开放公开测试,可从App Store下载。用户可手机启动云端Agent或远程控制桌面Agent,通过锁屏实时动态和推送通知掌握状态,查看演示、{代码差异|"代码差异"}并{合并PR|"合并Pull Request"}。cursor.com ↗

16. Gemini向美国用户开放个性化图像生成

结合个人偏好与Google Photos,生成贴合用户品味和形象的图像。blog.google:Blog ↗

17. Google AI Studio 分享应用可附带完整聊天记录

Google AI Studio 近日更新,用户在分享应用时可以选择通过一个开关包含完整的聊天历史,方便接收方查看创建时的所有提示和对话。X:GoogleAIStudio (@GoogleAIStudio) ↗

18. 豆包否认内测社交功能,称仅与飞书办公协同

用户发现类似IM功能,豆包回应仅为办公场景与飞书协同。ithome.com ↗

19. AI 短剧制作可免费使用

作者尝试制作修仙爽剧。量子位 ↗

20. OceanBase 发布 AI 数据库,融合湖库与多模态数据

让 AI 真正读懂企业。量子位 ↗

开发与基础设施

21. NVIDIA Rubin Ultra取消,新版尺寸性能减半

GTC 2026宣布Rubin Ultra仅3个月后,原4-die Rubin Ultra因制造执行问题被取消。新版尺寸减半,实际性能约为原版一半。X:SemiAnalysis (@SemiAnalysis_) ↗

22. Codex 团队宣布重置用量限制并修复消耗过快问题

Codex 团队于北京时间6月30日早上约8点宣布,即将完全重置 Codex 的用量限制,并在未来24小时内向用户的用量池额外增加一次手动重置额度。此前有用户报告用量消耗过快,团队调查后确认是由 Auto-review 过于主动及后台建议重试频繁等多个小问题叠加导致,目前已撤销相关改动并在各平台部署了热修复。X:thsottiaux (@thsottiaux) ↗

23. 美团发布并开源 1.6 万亿参数 LongCat-2.0 模型

美团龙猫团队正式发布并开源了总参数量达1.6万亿,激活参数480亿的{MoE语言模型|"MoE语言模型"} LongCat-2.0。官方称该模型在国产算力芯片上完成了预训练,支持 100 万上下文,在编程与智能体任务上表现强劲。现已通过 LongCat API 开放平台上线了限时抢购的资源包和 API 按量计费服务。longcat.chat:Blog ↗

24. 美国 National Design Studio 开源 14.7MB 浏览器端 PII 脱敏模型 Rampart

美国 National Design Studio 发布了一款仅 14.7MB 的开源模型 Rampart,能在浏览器内自动脱敏用户输入的姓名、地址等个人信息,再将内容发送给 AI 助手。该模型支持七种语言,但不包括中文。ndstudio.gov ↗

25. ComfyUI 推出 Comfy MCP 公开测试版

首个面向生产流水线的MCP,支持Claude、Codex、Hermes等Agent接入,自然语言运行工作流。blog.comfy.org:Blog ↗

26. GitLab 研究发现 AI 工具加速编码,但未提升整体软件交付

GitLab 2026 AI 问责报告揭示 AI 悖论:78% 开发者称编码更快,但下游测试和审查瓶颈及企业治理与可追溯性挑战导致整体软件交付未加速。InfoQ AI ↗

27. Target 基于 LLM 的语义匹配系统用于营销预测管道

Target 构建生成式 AI 系统,通过 Embedding、向量搜索和 LLM 排序,检索并排序相似历史营销活动,替代规则工作流。评估显示 Top-1 达 75%,Top-3 覆盖 100%。系统减少人工工作量,提高一致性,并利用反馈循环优化检索。InfoQ AI ↗

公司与资本

28. SK集团会长崔泰源:到2035年建设15GW AI数据中心,总投资1000万亿韩元

SK集团会长崔泰源宣布到2035年建成15GW AI数据中心容量,作为韩国国家级基础设施。项目总投资1000万亿韩元(约4.4万亿元),未来10年年均投资100万亿韩元以上,SK海力士另投400万亿韩元。IT之家(RSS) ↗

29. 三星和SK海力士计划投资5900亿美元扩产芯片,AI需求推高内存价格

在韩国政府支持下,三星和SK海力士计划投入5900亿美元扩大芯片产能,包括新建工厂、封装中心和研发。AI数据中心需求是主要驱动力,Jefferies预测2026年Q3内存价格将上涨40%至50%,2028年新产能上线15%至20%才可能缓解。The Decoder:AI News(RSS) ↗

30. 国务院印发《教育发展“十五五”规划》,推进人工智能全学段教育

国务院日前印发《教育发展“十五五”规划》,要求推进人工智能全学段教育,提升学生人工智能素养及提出问题、解决问题的能力。规划明确完善科学教育体系,强化科技教育与人文教育协同,加强青少年科学素养、批判性思维和创新能力培养。同时实施学生体质强健计划、心理健康促进行动,加大拔尖创新人才自主培养力度,推动学科交叉融合,扩大优质本科招生规模。目标到2030年高质量教育体系基本建成。IT之家(RSS) ↗

31. AI评估平台Arena年化营收突破1亿美元

商业化八个月,基于千万用户盲测排行,向企业收费。arena.ai ↗

32. 三星与SK公布超9000亿美元AI与半导体投资计划

三星投入2655万亿韩元,SK投入2100万亿韩元,用于半导体工厂和AI数据中心,仍处规划阶段。chosun.com ↗

33. OpenAI为Codex推出权限配置文件功能

OpenAI为Codex推出处于Beta阶段的权限配置文件功能,替代了旧版沙箱模式。该功能通过可继承的配置策略,精细控制文件读写与网络访问权限。其内置只读、工作区写入和完全访问三种模式,由操作系统强制实施。OpenAI ↗

34. 智平方获国家队及头部财投入局,估值 200 亿成粤港澳大湾区具身智能独角兽

智平方吸金 50 亿,全矩阵顶级资本重仓。量子位 ↗

35. 月之暗面警告老股转让欺诈,澄清未授权第三方参与融资

所有融资由公司直接负责,未经批准的老股转让无效。微信公众号 ↗

36. Claude Mythos 促使梁文锋决定融资

DeepSeek 不储备弹药将难以继续竞争。量子位 ↗

政策与安全

37. 美军用AI选目标误炸伊朗学校:Anthropic Claude嵌入Palantir首日建议约1000目标

美军首次大规模使用AI选择目标,Anthropic Claude嵌入Palantir Maven Smart System,首日建议约1000目标。导弹袭击学校致约120名儿童死亡,调查发现情报工具未连接军方目标数据库,信息从未送达指挥官。五角大楼推出agentic AI initiative。The Decoder:AI News(RSS) ↗

38. Claude Code打开GitHub仓库即执行隐藏恶意代码,攻击者可获完全控制

安全研究人员发现新攻击向量:看似正常的GitHub仓库包含setup脚本,从DNS条目拉取命令执行,恶意代码对扫描器和AI智能体不可见。Claude Code打开该仓库时自动运行脚本,打开反向shell,可窃取API密钥。建议AI智能体在运行前显示脚本内容。The Decoder:AI News(RSS) ↗

39. 词元盗用正成为 AI 商业化新风险

有人盯上的不是钱,而是 Token。量子位 ↗

40. 虚拟圆桌:机器时代的安全——AI 威胁演变专家见解

虚拟圆桌邀请 AI 安全专家探讨 AI 驱动威胁的演变,包括提示注入、数据投毒、代理滥用及 AI 社会工程。讨论新兴攻击模式、事件响应挑战及安全团队应做出的改变。InfoQ AI ↗

论文与研究

41. Meta发布Brain2Qwerty v2:非侵入式实时句子解码

Meta公布Brain2Qwerty v2,基于当天发表在《Nature》的v1,是性能最高的端到端管道,从原始脑信号实时解码句子。从字符级提升至解码单词和语义,有望帮助因脑损伤无法沟通的人群。X:AI at Meta (@AIatMeta) ↗

42. DiScoFormer:一个跨分布同时估计密度与分数的单一Transformer模型

DiScoFormer利用Transformer交叉注意力,单次前向传播输出密度和分数,无需重新训练。在100维空间中比最优KDE降低分数误差约6.5倍、密度误差超37倍,可泛化至非高斯分布。Hugging Face:Blog(RSS) ↗

43. OpenAI报告:绘制欧洲AI劳动力机遇版图

OpenAI发布新报告,分析AI对欧盟就业的影响,划定哪些职业面临自动化、增长或工作流程变化。OpenAI:官网动态(RSS · 排除企业/客户案例) ↗

观点与教程

44. Anthropic:当AI成本超过工程师薪酬

Anthropic在算力上的支出达到每位工程师每年51.5万美元,是其完全薪资(22.4万美元)的2.3倍。相比之下,顶尖1%软件公司的算力支出为8.9万美元,中位数仅为1.37万美元。三个2029年情景预测了这一差距的缩小路径。Tomer Tunguz 博客(VC 分析) ↗

45. Qwen 3.6 27B是本地开发的理想选择

Qwen 3.6 27B密集参数模型,原生支持256k上下文。在Macbook Max M5上llama.cpp Q8_0量化达30 tokens/s,RTX 5090上Q6_K达50 tokens/s。可完成创意诗歌、生成游戏等任务,作者推荐27B版本。Hacker News 热门(buzzing.cc 中文翻译) ↗

46. Anthropic工程师Margot Van Laar:提示词工程实战——调试生产提示词为主,评估是唯一严谨方式

Anthropic应用AI工程师Margot Van Laar分享:大部分时间在调试已有生产提示词而非从零编写。两个场景:客服机器人用XML标签清理,零售排班Agent拆成生成-评估-修复三个简单提示词更稳定。反复强调评估是唯一严谨方式。X:Berry Xia (@berryxia) ↗

47. 分享两个Vibe Coding必备的实用Prompt:第一性原理与对抗式审查

作者分享Vibe Coding中两个关键Prompt:一是“从第一性原理出发”,强制AI跳出类比推理,从基本事实重新推导本质,曾帮作者发现AIHOT抓取海外信源的底层流量路由隐患并彻底重构;二是“对抗式审查”,让AI站在恶意用户角度攻防式审查代码,检出OOM死循环、未来时间污染等手工难发现的BUG。两个Prompt形成生成与验证闭环,使纯Vibe Coding项目AIHOT最近一周请求量超千万次。公众号:数字生命卡兹克 ↗

48. AI 当老板,致 10 家公司濒临破产

画出那个矩阵的能力仍属于人类。量子位 ↗

49. 智谱创始人唐杰:认知大于格局与技术

技术迭代极快,管理地位下降,需持续追赶。weibo.com ↗

50. 企业AI投资升温,代理智能成关键

Gartner将2026年称为企业对齐AI项目与战略目标的转折年,高管们正寄望于代理AI驱动可量化的财务成果。MIT科技评论AI ↗

51. AI 代理不是你的“同事”

想象上班时得知一名新下属将向你汇报,它并非人类,而是 AI 工具,但公司却称之为 Alex……。MIT科技评论AI ↗

今日脉络

  • 模型新势力:国产大模型登顶与低价订阅
    美团LongCat Owl Alpha以1.6万亿参数MoE模型成为OpenRouter最流行模型,完全在国产ASIC训练。ClinePass订阅首月仅1.99美元即可使用GLM 5.2等模型。

  • 安全与基础设施挑战加剧
    词元盗用成为AI商业化新风险,Claude Code打开恶意仓库可执行隐藏代码,NVIDIA Rubin Ultra因制造问题取消。

总结

今日AI动态显示国产模型已具备全球竞争力,应用层移动化、平台化加速,但安全事件与硬件调整警示行业需同步加强防护与基础设施韧性。