模型发布/更新

1. ERNIE 5.1 发布,预训练成本仅需对标模型 6%

百度发布 ERNIE 5.1,基于 ERNIE 5.0 预训练基础升级了搜索、推理、知识问答、创意写作和智能体能力,预训练成本仅需对标模型的约 6%。X:百度 Baidu ↗

2. HappyHorse 上线阿里云,AI 视频无需等待

基准测试排名第一的 AI 视频生成模型 HappyHorse 现已在阿里云 Model Studio 上线,支持原生音视频同步,闪电速度生成。X:阿里云 / Alibaba Cloud ↗

3. StepAudio 2.5 TTS 在语音竞技场盲测中跻身全球前三

StepFun 推出的 StepAudio 2.5 TTS 在 Artificial Analysis 语音竞技场盲测中位列全球第三,Elo 评分 1187 分,以 8 分优势超越 Eleven v3,定价为每百万字符 85 美元。X:阶跃星辰 StepFun ↗

产品发布/更新

4. Google 开放 Fitbit Air 的全新 Health API

Google 随新款 Fitbit Air 发布全新 Health API,涵盖运动、睡眠、心率、血氧等 31 种健康数据点,支持 Webhooks 实时推送,开发者可基于个人健康数据构建 AI Agent、MCP Server 等应用。X:Berry Xia ↗

5. OpenRouter 推出帕累托代码:免费实验性编码路由工具

OpenRouter 推出帕累托代码,一款免费实验性编码路由工具,设置 min_coding_score 即可路由至符合标准且成本最低的编码模型,排名由 Artificial Analysis 提供。X:OpenRouter ↗

6. Peekaboo 3.0 正式发布,专注操作与界面检测

macOS 电脑使用工具 Peekaboo 发布 3.0 大版本,支持以操作为先的使用体验、统一截图与界面检测功能、CLI 与 MCP 间更简洁的 JSON 交互。X:Peter Steinberger ↗

7. Qwen 系列多尺寸模型登陆 SiliconFlow 平台

阿里 Qwen 3.5 和 Qwen3.6 系列已在 SiliconFlow 上线,覆盖 9B 到 397B 参数规模,支持 MoE 与 Dense 架构及原生多模态。X:硅基流动 SiliconFlow ↗

8. Claude Code v2.1.137 修复 Windows VS Code 扩展激活问题

Claude Code 发布 v2.1.137,修复了 Visual Studio Code 扩展在 Windows 操作系统上无法激活的问题,专注提升特定平台下的扩展兼容性与稳定性。GitHub Releases ↗

9. Claude Code v2.1.138 发布,内部修复优化

Claude Code 更新至 v2.1.138,进行了一系列内部修复,旨在优化系统底层性能或解决已知问题,主要集中在后台代码的调整与完善。GitHub Releases ↗

行业动态

10. Claude Mythos 评估显示 16 小时风险时距

METR 在 2026 年 3 月有限窗口内评估了 Claude Mythos Preview 早期版本的风险,在其任务套件上估计 50% 时间范围至少为 16 小时,处于可测量上限。X:Ethan Mollick ↗

11. DeepSeek 融资 70 亿美元创纪录,创始人个人出资 30 亿

DeepSeek 正以 500 亿美元估值进行高达 70 亿美元融资,创下中国 AI 领域最大单轮纪录。创始人梁文锋个人出资 30 亿美元占本轮融资 40%,同时仍保留公司 90% 所有权,融资将用于获取大规模计算资源加速新模型发布。X:Rohan Paul ↗

12. 工信部启动人工智能科技伦理审查与服务先导计划

工业和信息化部近日启动人工智能科技伦理审查与服务先导计划,部署四项重点任务,包括细化省级伦理审查制度、指导创新主体建设伦理委员会等,将设立全国伦理风险监测服务网络。IT之家 ↗

13. Hermes Agent 登顶 OpenRouter 全球令牌排名

Hermes Agent 在全球 OpenRouter 令牌排名中位列第一,NousResearch 感谢贡献者、支持者和用户一路以来的支持。X:OpenRouter ↗

14. 腾讯混元 Hy3 预览版免费期结束,三项指标居首

腾讯混元 Hy3 预览版在 OpenRouter 两周免费期内达成总令牌使用量、代码生成、工具调用三项排名第一,在所有供应商中占据 15.4% 市场份额。X:腾讯混元 ↗

论文研究

15. 菲尔兹奖得主称 ChatGPT 5.5 Pro 两小时内完成"博士级"数学研究

菲尔兹奖得主蒂莫西·高尔斯让 ChatGPT 5.5 Pro 尝试解决数论中的开放性问题,该模型在不到一小时内将一个指数界限改进为多项式界限,MIT 研究员认为其核心想法"完全具有原创性"。The Decoder ↗

16. Anthropic 发布"Teaching Claude Why"新研究

Anthropic 发布新研究,通过让 Claude 学习解释自身推理过程中的"为什么",显著提升了推理能力和输出准确性,旨在推动 AI 向更可解释、更可靠的方向发展。Anthropic Research ↗

17. OncoAgent:用于隐私保护肿瘤临床决策支持的双层多智能体框架

研究团队发布开源肿瘤临床决策支持系统 OncoAgent,采用双层多智能体架构结合四阶段 Corrective RAG 流程,检索超过 70 份权威临床指南,支持完全本地部署以保护患者数据主权。Hugging Face Blog ↗

技巧与观点

18. Redis 创始人用 C 语言引擎将大模型"装进"个人电脑

Redis 创始人 Antirez 开源了专为 DeepSeek V4 Flash 设计的原生推理引擎 ds4,仅用几千行 C 代码,通过对 MoE 专家进行 2-bit 量化、KV Cache 移至高速 SSD、为 Apple Silicon 进行 Metal 原生优化,成功在 128GB MacBook Pro 上流畅运行 1M 上下文窗口模型,实测达 27 tok/s。X:阿易 AI Notes ↗

19. AI 放大能动性差异,用户两极分化加剧

Francois Chollet 指出主观能动性具有自我增强特性,而 AI 正在放大这种效应——低能动性的 AI 使用者进一步丧失能动性,高能动性的 AI 使用者则进一步增强能动性。X:Francois Chollet ↗

20. YC CEO 开源个人 AI 操作系统 GBrain,构建知识复利"第二大脑"

Y Combinator CEO Garry Tan 开源其个人 AI 操作系统 GBrain,通过"Book Mirror""Meeting Prep"等模块化技能,五个月内深度处理了 20 多本书,管理着超 10 万页持续增长的结构化知识。X:Berry Xia ↗

21. GPT Image 2 Prompt:中文科技新闻爆款封面生成器

一套用于生成中文科技新闻爆款封面图的详细提示词框架,要求 AI 扮演顶级视觉设计师,融合中国科技媒体头图和 B 站爆款缩略图等风格,输出专业的 16:9 横版媒体级封面图。X:宝玉 ↗

22. GPT-Realtime-2 语音控制 CRM 集成方案

OpenAI Developers 介绍了如何集成 GPT-Realtime-2 为 CRM 工作流添加语音控制功能。X:OpenAI Developers ↗

23. 用 Codex 并行调试验证修复

用户分享了使用 Codex 在临时 crabbox 中重建精确状态、验证 bug、修复并再验证的工作流,支持并行运行 10 个会话提高效率。X:Peter Steinberger ↗

24. 手机扫描与 AI Agent 技术颠覆房地产与专业领域

"3D 高斯泼溅"技术允许用户仅用手机扫描整栋房屋即可生成沉浸式 3D 模型,成本极低。同时 AI 在垂直专业领域通过 Agent 范式取得突破,如 Tianfu Agent 在专业命理大赛中接近人类顶尖水平。X:阿易 AI Notes ↗

25. Codex Chrome 插件安装与使用经验分享

用户分享了 Codex Chrome 插件的安装经验,需将 Codex 更新至最新版本并切换为官方订阅登录模式,安装后通过"@Chrome"指令调用插件功能。X:Vista ↗