AI日报 · 2026-05-10 - ephron's blog

模型发布/更新

1. ERNIE 5.1 发布，预训练成本仅需对标模型 6%

百度发布 ERNIE 5.1，基于 ERNIE 5.0 预训练基础升级了搜索、推理、知识问答、创意写作和智能体能力，预训练成本仅需对标模型的约 6%。X：百度 Baidu ↗

2. HappyHorse 上线阿里云，AI 视频无需等待

基准测试排名第一的 AI 视频生成模型 HappyHorse 现已在阿里云 Model Studio 上线，支持原生音视频同步，闪电速度生成。X：阿里云 / Alibaba Cloud ↗

3. StepAudio 2.5 TTS 在语音竞技场盲测中跻身全球前三

StepFun 推出的 StepAudio 2.5 TTS 在 Artificial Analysis 语音竞技场盲测中位列全球第三，Elo 评分 1187 分，以 8 分优势超越 Eleven v3，定价为每百万字符 85 美元。X：阶跃星辰 StepFun ↗

产品发布/更新

4. Google 开放 Fitbit Air 的全新 Health API

Google 随新款 Fitbit Air 发布全新 Health API，涵盖运动、睡眠、心率、血氧等 31 种健康数据点，支持 Webhooks 实时推送，开发者可基于个人健康数据构建 AI Agent、MCP Server 等应用。X：Berry Xia ↗

5. OpenRouter 推出帕累托代码：免费实验性编码路由工具

OpenRouter 推出帕累托代码，一款免费实验性编码路由工具，设置 min_coding_score 即可路由至符合标准且成本最低的编码模型，排名由 Artificial Analysis 提供。X：OpenRouter ↗

6. Peekaboo 3.0 正式发布，专注操作与界面检测

macOS 电脑使用工具 Peekaboo 发布 3.0 大版本，支持以操作为先的使用体验、统一截图与界面检测功能、CLI 与 MCP 间更简洁的 JSON 交互。X：Peter Steinberger ↗

7. Qwen 系列多尺寸模型登陆 SiliconFlow 平台

阿里 Qwen 3.5 和 Qwen3.6 系列已在 SiliconFlow 上线，覆盖 9B 到 397B 参数规模，支持 MoE 与 Dense 架构及原生多模态。X：硅基流动 SiliconFlow ↗

8. Claude Code v2.1.137 修复 Windows VS Code 扩展激活问题

Claude Code 发布 v2.1.137，修复了 Visual Studio Code 扩展在 Windows 操作系统上无法激活的问题，专注提升特定平台下的扩展兼容性与稳定性。GitHub Releases ↗

9. Claude Code v2.1.138 发布，内部修复优化

Claude Code 更新至 v2.1.138，进行了一系列内部修复，旨在优化系统底层性能或解决已知问题，主要集中在后台代码的调整与完善。GitHub Releases ↗

行业动态

10. Claude Mythos 评估显示 16 小时风险时距

METR 在 2026 年 3 月有限窗口内评估了 Claude Mythos Preview 早期版本的风险，在其任务套件上估计 50% 时间范围至少为 16 小时，处于可测量上限。X：Ethan Mollick ↗

11. DeepSeek 融资 70 亿美元创纪录，创始人个人出资 30 亿

DeepSeek 正以 500 亿美元估值进行高达 70 亿美元融资，创下中国 AI 领域最大单轮纪录。创始人梁文锋个人出资 30 亿美元占本轮融资 40%，同时仍保留公司 90% 所有权，融资将用于获取大规模计算资源加速新模型发布。X：Rohan Paul ↗

12. 工信部启动人工智能科技伦理审查与服务先导计划

工业和信息化部近日启动人工智能科技伦理审查与服务先导计划，部署四项重点任务，包括细化省级伦理审查制度、指导创新主体建设伦理委员会等，将设立全国伦理风险监测服务网络。IT之家 ↗

13. Hermes Agent 登顶 OpenRouter 全球令牌排名

Hermes Agent 在全球 OpenRouter 令牌排名中位列第一，NousResearch 感谢贡献者、支持者和用户一路以来的支持。X：OpenRouter ↗

14. 腾讯混元 Hy3 预览版免费期结束，三项指标居首

腾讯混元 Hy3 预览版在 OpenRouter 两周免费期内达成总令牌使用量、代码生成、工具调用三项排名第一，在所有供应商中占据 15.4% 市场份额。X：腾讯混元 ↗

论文研究

15. 菲尔兹奖得主称 ChatGPT 5.5 Pro 两小时内完成"博士级"数学研究

菲尔兹奖得主蒂莫西·高尔斯让 ChatGPT 5.5 Pro 尝试解决数论中的开放性问题，该模型在不到一小时内将一个指数界限改进为多项式界限，MIT 研究员认为其核心想法"完全具有原创性"。The Decoder ↗

16. Anthropic 发布"Teaching Claude Why"新研究

Anthropic 发布新研究，通过让 Claude 学习解释自身推理过程中的"为什么"，显著提升了推理能力和输出准确性，旨在推动 AI 向更可解释、更可靠的方向发展。Anthropic Research ↗

17. OncoAgent：用于隐私保护肿瘤临床决策支持的双层多智能体框架

研究团队发布开源肿瘤临床决策支持系统 OncoAgent，采用双层多智能体架构结合四阶段 Corrective RAG 流程，检索超过 70 份权威临床指南，支持完全本地部署以保护患者数据主权。Hugging Face Blog ↗

技巧与观点

18. Redis 创始人用 C 语言引擎将大模型"装进"个人电脑

Redis 创始人 Antirez 开源了专为 DeepSeek V4 Flash 设计的原生推理引擎 ds4，仅用几千行 C 代码，通过对 MoE 专家进行 2-bit 量化、KV Cache 移至高速 SSD、为 Apple Silicon 进行 Metal 原生优化，成功在 128GB MacBook Pro 上流畅运行 1M 上下文窗口模型，实测达 27 tok/s。X：阿易 AI Notes ↗

19. AI 放大能动性差异，用户两极分化加剧

Francois Chollet 指出主观能动性具有自我增强特性，而 AI 正在放大这种效应——低能动性的 AI 使用者进一步丧失能动性，高能动性的 AI 使用者则进一步增强能动性。X：Francois Chollet ↗

20. YC CEO 开源个人 AI 操作系统 GBrain，构建知识复利"第二大脑"

Y Combinator CEO Garry Tan 开源其个人 AI 操作系统 GBrain，通过"Book Mirror""Meeting Prep"等模块化技能，五个月内深度处理了 20 多本书，管理着超 10 万页持续增长的结构化知识。X：Berry Xia ↗

21. GPT Image 2 Prompt：中文科技新闻爆款封面生成器

一套用于生成中文科技新闻爆款封面图的详细提示词框架，要求 AI 扮演顶级视觉设计师，融合中国科技媒体头图和 B 站爆款缩略图等风格，输出专业的 16:9 横版媒体级封面图。X：宝玉 ↗

22. GPT-Realtime-2 语音控制 CRM 集成方案

OpenAI Developers 介绍了如何集成 GPT-Realtime-2 为 CRM 工作流添加语音控制功能。X：OpenAI Developers ↗

23. 用 Codex 并行调试验证修复

用户分享了使用 Codex 在临时 crabbox 中重建精确状态、验证 bug、修复并再验证的工作流，支持并行运行 10 个会话提高效率。X：Peter Steinberger ↗

24. 手机扫描与 AI Agent 技术颠覆房地产与专业领域

"3D 高斯泼溅"技术允许用户仅用手机扫描整栋房屋即可生成沉浸式 3D 模型，成本极低。同时 AI 在垂直专业领域通过 Agent 范式取得突破，如 Tianfu Agent 在专业命理大赛中接近人类顶尖水平。X：阿易 AI Notes ↗

25. Codex Chrome 插件安装与使用经验分享

用户分享了 Codex Chrome 插件的安装经验，需将 Codex 更新至最新版本并切换为官方订阅登录模式，安装后通过"@Chrome"指令调用插件功能。X：Vista ↗

AI日报 · 2026-05-10