AI日报 · 2026-05-15 - ephron's blog

模型发布/更新

1. SenseNova U1 技术报告发布，基于 MoE 架构开源模型权重

由联合创始人兼首席科学家李沐博士领导的团队发布了 SenseNova U1 技术报告，详细阐述其架构、训练方案与创新突破。此次开源同步发布了基于混合专家模型（MoE）的新权重，旨在推动 AI 领域的透明度与可复现性。X：商汤 SenseTime ↗

2. Granite Embedding Multilingual R2：开源多语言嵌入模型，32K 上下文领先检索性能

IBM Granite 团队在 Hugging Face 发布了 Granite Embedding Multilingual R2 多语言文本嵌入模型，采用 Apache 2.0 协议，上下文长度扩展至 32K tokens，在 MTEB 基准检索评估中取得同规模最佳性能，擅长多语言混合检索。Hugging Face：Blog ↗

3. 蚂蚁 inclusionAI 发布 Ring-2.6-1T 模型

inclusionAI 发布了 Ring-2.6-1T 模型，在 Claw-Eval 基准测试中通用能力评估得分 58.4，多轮对话评估得分 86.8。蚂蚁 inclusionAI：HuggingFace ↗

4. Kimi K2.6 登顶金融智能体基准榜首

Kimi K2.6 现已成为 Finance Agent Benchmark V2 开源权重排名第一，展示了在金融分析任务中的强大能力。X：Kimi.ai ↗

产品发布/更新

5. Kimi 推出网页桥接扩展，支持多平台交互

Kimi 的浏览器扩展让智能体可以像人类一样与网站互动——搜索、滚动、点击、输入并完成任务。支持 Kimi Code CLI、Claude Code、Cursor、Codex、Hermes 等平台，已在 Chrome 应用商店上线。X：Kimi.ai ↗

6. OpenAI 让 Codex 走进移动端，随时随地管理编程任务

用户现可通过 ChatGPT 移动应用随时随地使用 Codex，支持跨设备和远程环境实时监控、引导及批准编码任务，实现编程工作的无缝移动端管理。OpenAI：官网动态 ↗

7. OpenCode 与 Qwen 3.6 Plus 再度免费开放

OpenCode 联合 Qwen 3.6 Plus 开启第二轮免费使用，团队表示已找到更多 GPU 资源来应对上次的高需求。X：opencode ↗

8. Codex 推出自动化钩子与程序化访问令牌

Codex 新增"钩子"功能，允许在任务关键节点运行脚本进行工作验证、扫描密钥等操作。同时面向商业和企业团队推出"程序化访问令牌"，支持 CI/CD 和内部自动化流程。X：OpenAI Developers ↗

9. Luma Agents 高效生成电商素材全流程

Luma Agents 支持定义需求、设定风格后自动处理所有电商活动素材，帮助用户在产品、市场和多种格式间实现无瓶颈的内容生产。X：Luma AI ↗

10. xAI 推出 Grok Build 早期测试版，编程智能体登陆终端

xAI 面向 SuperGrok Heavy 订阅用户推出 Grok Build，这是一个在终端运行的编程智能体与命令行工具。核心功能包括"计划模式"允许在代码执行前审查步骤，能无缝集成现有开发工具链，并可将大型任务交由并行运行的子智能体处理。xAI：News ↗

11. SuperGrok Heavy 限时六折，Grok Build 开放测试

SuperGrok Heavy 现提供约 67% 的半年折扣，即每月仅需 99 美元（原价 300 美元），同时 Grok Build 测试版已开放使用。X：cb_doge ↗

12. 开源工具 html-anything 助力 Agent 生成高质量 HTML

开源项目 html-anything 让 AI Agent 能将任何数据转换为具有世界级设计水准的 HTML 代码，支持 75 套 Skills 和 9 种导出格式，兼容 Claude Code、Codex、OpenClaw、Hermes 等多种代码生成 Agent。X：小互 ↗

行业动态

13. Anthropic 与盖茨基金会达成 2 亿美元合作，聚焦全球健康与教育

Anthropic 与盖茨基会建立为期四年、总额 2 亿美元的合作，通过资金、Claude 使用额度及技术支持，共同推进全球健康、生命科学、教育及经济流动项目。重点包括改善中低收入国家约 46 亿人口的基本医疗，利用 AI 加速疫苗与疗法研发。Anthropic：Newsroom ↗

14. OpenEvidence 覆盖 65% 美国医生，Shadow AI 模式引关注

OpenEvidence 已覆盖 65% 的美国医生，4 月单月临床场景使用达 2700 万次。平台由医生个人通过执业编号在手机上注册，医院最初不知情，Mount Sinai 的 AI 负责人称此为 shadow AI。X：小北 ↗

15. OpenAI 遭集体诉讼，被指通过追踪代码向 Meta 泄露用户查询隐私

南加州联邦法院已受理针对 OpenAI 的集体诉讼，指控其在 ChatGPT 网站中嵌入 Facebook Pixel 等代码侵犯用户隐私。当用户提交查询时，查询主题会作为浏览器标题与含 Facebook 唯一 ID 的 cookies 一并实时发送给 Meta。X：阿易 AI Notes ↗

16. 百度推进智能体布局，以日活为关键指标

百度推进智能体组合以拥抱智能体时代，主张将日活跃智能体作为关键指标，衡量 AI 产品的实际价值。X：百度 Baidu ↗

17. AI 热潮引发民怨：七成美国民众反对家门口建数据中心

盖洛普调查显示，高达七成美国民众反对在住宅附近建设数据中心，全美已有 69 个辖区出台暂停令。数据中心建设推高批发电价，导致用电成本激增，并引发空气污染、水资源消耗等担忧。IT之家 ↗

18. MiMo V2.5 Pro 获设计竞技场季度军

MiMo V2.5 Pro 在 DesignArena 上获得第三名，Thinking 版本在总排行榜上比 MiMo-V2.5 提升了 8 个名次，在前端编码任务中达到与 Claude Sonnet 4.6 相同的性能水平。X：小米 MiMo ↗

19. Runway 进军日本市场，投资 4000 万美元开设东京办公室

Runway 宣布扩张至日本，投资 4000 万美元设立东京办公室。日本已成为 Runway 最大且增长最快的市场之一，过去 12 个月企业客户基础增长三倍，跃升为全球第三大市场。X：Runway ↗

论文研究

20. NousResearch 推出 Token Superposition Training 技术，显著加速大模型预训练

NousResearch 发布了 Token Superposition Training（TST），在不改变模型架构、优化器、分词器或训练数据的前提下，可在相同计算量下实现 2-3 倍的训练时间加速。其核心是在训练的前三分之一阶段让模型读取并预测连续的 token 包，推理阶段的模型与传统预训练完全相同。X：硅基流动 SiliconFlow ↗

21. 教视觉-语言模型说"电影语言"

研究团队与百余位专业创作者历时一年，构建了视频描述生成流程，核心在于扩展精细化的人类-AI 协同监督。该研究入选 CVPR 2026 亮点论文，指出当前主流视频生成模型在理解和生成具有电影感的专业运镜时存在明显不足。CMU：Machine Learning Blog ↗

技巧与观点

22. 微信群聊总结 Skill 新增，依赖 wx-cli 配置

baoyu-skills 新增微信群聊总结 Skill，依赖于 wx-cli 工具读取数据，使用 Claude Code + Claude Opus 4.6 效果最佳。X：宝玉 ↗

23. UnslothAI 发布 Qwen3.6 MTP GGUF 模型，推理速度大幅提升

UnslothAI 创始人 Daniel Han 发布了实验性 Qwen3.6 MTP GGUF 模型，27B 模型在单 GPU 上达到每秒 140 个 token，35B-A3B 版本更是高达每秒 220 个 token，相比原版 GGUF 速度提升超过 1.4 倍且精度无损。X：Berry Xia ↗

24. 克劳德代码与《代码书》技能：有针对性的技能培养

开发者发布了名为"克劳德代码与《代码书》技能"的 GitHub 工具，通过刻意练习提升编程技能，将传统的广泛学习转化为聚焦、可重复的技能训练模式。Hacker News 热门 ↗

25. Anthropic 发布创始人手册：构建 AI 原生初创公司

Anthropic 发布面向 AI 原生初创企业的实用指南，涵盖构思、最小可行产品、发布和规模化四个核心阶段，为每个阶段提供具体目标、退出标准及常见失败模式，并整合了多家初创企业的实践案例。Claude：Blog ↗

26. 腾讯开源 Agent Memory，让 Token 消耗降低 61%

腾讯云开源了 TencentDB Agent Memory，采用"上下文卸载"与"Mermaid 任务画布"两项核心技术，将完整信息卸载至外部存储，同时用结构化任务图保留关键状态。实验显示在多任务连续会话中最高可降低 61% 的 Token 消耗。IT之家 ↗

27. 在大型代码库中高效运用 Claude Code：最佳实践与入门指南

Claude Code 的核心在于围绕模型构建的"工具套件"，包含五个关键扩展点：CLAUDE.md 文件、钩子、技能、插件以及 MCP 服务器，采用智能体搜索模式直接在开发者本地代码库上操作，避免了传统 RAG 系统在活跃大型代码库中索引过时的问题。Claude：Blog ↗

28. 开源项目 OpenSquilla：智能路由与本地检索，大幅降低 LLM 使用成本

开源项目 OpenSquilla 针对大语言模型 Token 消耗过高的问题，提出了智能模型路由与本地向量检索相结合的解决方案。系统能自动判断任务复杂度，将简单问题路由至廉价模型，实际传输 Token 减少了 90% 以上。X：Vista ↗

29. Moonshot AI 创始人杨植麟拆解 Kimi K2 训练，460 万美元击败 GPT-5.5

杨植麟在 40 分钟视频中拆解 Kimi K2 模型的训练，仅花费 460 万美元便在编程大战中击败 GPT-5.5 等对手。通过极致优化、线性注意力等架构创新，抹平资源差距，标志 AI 竞赛规则改变。X：Berry Xia ↗

AI日报 · 2026-05-15