AI日报 · 2026-05-23 - ephron's blog

模型发布/更新

1. 首个基于华为昇腾910B全栈训练的1.58比特开源模型BitCPM-CANN发布

ModelBest、清华大学与OpenBMB社区联合发布全球首个完全基于华为昇腾910B NPU训练的开源1.58比特三元大模型BitCPM-CANN，其极低比特量化技术能显著降低模型内存占用。X：Rohan Paul (@rohanpaul_ai) ↗

2. 智谱发布高速版旗舰模型GLM-5.1-HighSpeed，速度达400 tokens/s

智谱发布了旗舰模型GLM-5.1的高速版本API“GLM-5.1-HighSpeed”，官方称在保留原模型能力下速度达400 tokens/s，目前仅面向部分企业客户开放。微信文章 ↗

3. 阿里云百炼上线旗舰模型Qwen3.7-Max并提供限时优惠

阿里巴巴最新旗舰模型Qwen3.7-Max已接入千问多端供免费体验，同时阿里云百炼针对该模型提供限时五折优惠。微信文章 ↗

4. 网易有道推出14语言零样本语音克隆引擎Confucius4-TTS

网易有道推出Confucius4-TTS，支持14种语言的零样本声音克隆与跨语言合成，据称3秒即可复刻原声且准确度超97%。模型权重即将开源。huggingface.co ↗

产品与工具

5. DeepSeek将V4-Pro API优惠转为永久定价

DeepSeek宣布将DeepSeek-V4-Pro模型API现有的2.5折优惠转为永久定价，此价格将于原定5月31日优惠结束后正式生效。api-docs.deepseek.com ↗

6. 谷歌I/O发布AI代理全套开发工具链，包括Antigravity 2.0

谷歌在I/O开发者大会宣布系统性构建面向AI代理的开发与部署工具链，核心更新包括独立桌面应用Antigravity 2.0及其命令行工具、SDK，以及AI Studio新增Kotlin支持。X：Google AI (@GoogleAI) ↗

7. Antigravity大幅更新：翻倍上下文长度，配额提至九倍

Antigravity发布重大更新，将Gemini 3.5 Flash最大上下文长度翻倍，付费订阅每周Gemini配额提至九倍并重置额度，同时新增IDE打开按钮并修复了Windows故障。X ↗

8. Claude Code的自动模式面向Pro用户开放，支持新模型

Claude Code的自动模式现已面向Pro订阅用户开放，并新增对Sonnet 4.6和Opus 4.7模型的支持。用户可通过Shift+Tab组合键启动。X：Claude Devs (@ClaudeDevs) ↗

9. Warp向免费用户开放BYOK功能，支持自定义端点

终端工具Warp宣布向免费计划用户开放自带模型密钥功能，并全面支持兼容OpenAI Chat Completions API的自定义推理端点。docs.warp.dev ↗

10. TRAE中国版上线Kimi模型原生视频理解能力

TRAE中国版内置的Kimi-K2.6和Kimi-K2.5模型现已上线原生视频理解能力，可让Agent直接看懂并解析视频内容。微信文章 ↗

11. OpenAI Codex /goal功能正式发布及使用指南

OpenAI宣布Codex的/goal模式结束实验成为稳定功能。用户可在Codex应用、IDE扩展或CLI中使用，通过设定具体里程碑让AI持续工作直至完成。X：宝玉 (@dotey) ↗

12. OpenAI测试ChatGPT简化版模型选择器

OpenAI正在ChatGPT网页端测试名为“Intelligence”的简化版模型选择器，将原有的模型与推理档位精简为四个选项，允许用户恢复常用设置。X ↗

13. DeepSeek V4 Flash登顶OpenRouter周排行榜

在OpenRouter平台，DeepSeek V4 Flash模型已登顶周排行榜。X：OpenRouter (@OpenRouter) ↗

14. xAI发布Grok Skills并更新工具调用API

xAI发布了Grok Skills以及针对Grok 4.3的Responses API增强功能，支持持久化自定义体验和更强大的工具调用。InfoQ AI ↗

15. Gemini Omni发布，创意作品涌现

Gemini Omni发布后，社区涌现出许多令人惊叹的创作作品。X：Gemini (@GeminiApp) ↗

16. Viggle AI使动作捕捉与角色动画制作更轻松

Viggle AI称其工具让动作捕捉和角色动画制作变得前所未有的简单，并承诺将推出更多功能。X：Viggle AI (@ViggleAI) ↗

17. ChatGPT语音模式实现表单语音填写

借助ChatGPT的图像功能和语音模式，用户可以上传表单，通过语音说出要填写的内容，即可获得填写完成的版本。X：ChatGPT (@ChatGPTapp) ↗

18. Project Genie与谷歌街景合作推出交互式世界

Google DeepMind的Project Genie与谷歌地图街景合作，现在可以将真实的美国地点转化为全新的交互式世界。X：Google DeepMind (@GoogleDeepMind) ↗

19. Suno AI创作夏日神曲《波多黎各》爆火

由Suno AI创作的歌曲《Puerto Rico》成为夏日热门歌曲，并通过媒体GMA的报道获得更广泛传播。X：Suno (@suno) ↗

开发与工程

20. Perplexity开源供应链安全扫描工具Bumblebee

Perplexity宣布开源内部安全工具Bumblebee，这是一款适用于macOS和Linux的只读扫描器，可检查开发者机器上的高风险软件包和配置。GitHub ↗

21. Cloudflare完成智能体基础设施栈，重建Browser Run

Cloudflare在其自有Containers平台上重建了Browser Run，实现了4倍更高的并发和50%更快的响应速度，完善了其智能体基础设施栈。InfoQ AI ↗

22. Kakuna：一款将原型代码自动加固为生产级代码的AI代理工具

Kakuna是一款AI代理工具，旨在将早期快速原型自动转化为可维护的生产级代码库，通过模拟人类流程自动执行代码审查、测试补充等工作。X：swyx (@swyx) ↗

23. OpenAI新增差异标记样式设置选项

OpenAI在开发者工具的外观设置中新增了差异标记样式选项，允许用户在查看代码差异时选择经典的+/-标记。X：OpenAI Developers (@OpenAIDevs) ↗

24. Discord如何用自动化框架管理海量ScyllaDB数据库

Discord详细介绍了其如何围绕一个新的内部编排框架重建数据库运维，以管理其规模庞大的ScyllaDB集群。InfoQ AI ↗

25. AI原生工程实践分享：Meta Reality Labs案例

Meta Reality Labs的Ian Thomas分享了一个拥抱AI原生工程的案例，介绍了“评估与采用”等实践方法。InfoQ AI ↗

26. Uber使用实时信号和列表排名改进餐厅推荐

Uber更新了其Uber Eats首页推荐系统，使用了近实时用户序列特征和生成式列表排名技术。InfoQ AI ↗

行业与公司

27. DeepSeek推进700亿元巨额融资，承诺坚持开源路线

AI公司DeepSeek正推进约700亿元人民币的融资，估值达450亿美元。创始人梁文锋承诺将继续开源开发AI模型，不追求短期商业化，目标指向技术升级与通用人工智能。IT之家（RSS） ↗

28. Cursor被评为2026年Gartner企业级AI编码代理魔力象限领导者

Gartner在2026年魔力象限报告中，将Cursor评为企业级AI编码代理领域的领导者，并在愿景完整性上领先。超过70%的财富500强企业使用Cursor。Cursor Blog ↗

29. GitHub连续第三年被Gartner评为企业级AI编程代理领导者

Gartner最新魔力象限报告将GitHub连续第三年列为“领导者”象限，该评估专注于企业级AI编程代理领域。GitHub Blog ↗

30. OpenAI被Gartner评为企业AI编码代理领域领导者

Gartner发布2026年企业AI编码代理魔力象限报告，OpenAI被列为领导者，其产品Codex因技术创新和企业级部署表现获得认可。OpenAI：官网动态（RSS · 排除企业/客户案例） ↗

31. 英伟达财报亮眼，黄仁勋预测AI基建年开支将冲4万亿美元

英伟达发布2027财年Q1财报，营收816亿美元，同比增长85%。黄仁勋预测，超大规模云厂商的AI基建年度开支将从1万亿美元增长至3-4万亿美元。IT之家（RSS） ↗

32. 有关部门正推进国产大模型适配国产算力芯片

据报道，有关部门表示正指导国产大模型适配国产算力芯片，并谋划出台加快“人工智能+”落地配套文件，推动央国企开放应用场景。ndrc.gov.cn ↗

33. 深圳AI公司狂揽F轮融资，用户达4100万

一家深圳的AI公司狂揽F轮融资，用户数量达到4100万，其产品致力于将企业旧系统变成AI能力库。量子位 ↗

34. 80集短剧3天拍完：影视Agent如何提效数十倍

一家影视公司利用AI Agent将80集短剧的拍摄时间缩短至3天，提效数十倍的同时Token消耗直降70%。量子位 ↗

35. 联想集团第四季度营收利润双创新高

联想集团公布第四季度及全年财报，营收利润双创新高，调整后净利润同比增长42.1%，兑现历史最佳财年。量子位 ↗

论文与研究

36. Anthropic公布Project Glasswing进展：AI已发现超万高危漏洞

Anthropic公布Project Glasswing项目进展，宣称其Claude Mythos Preview模型已在关键软件及开源项目中发现超一万个高危或严重漏洞。Anthropic：Newsroom（网页） ↗

37. Google DeepMind发布AlphaProof Nexus数学证明框架

Google DeepMind推出AlphaProof Nexus框架，通过结合大型语言模型与Lean编译器进行数学形式化证明搜索，相关结果与代码已公开。arxiv.org ↗

38. 图灵测试76年后首现实证：GPT-4.5以73%判定率超越真人

加州大学圣地亚哥分校研究首次实证现代AI可通过图灵测试。研究表明，GPT-4.5在特定提示下被误认为人类的概率高达73%，显著超过真人。IT之家（RSS） ↗

39. VSAS-Bench：面向视觉流式辅助模型的实时评估基准

研究团队提出了VSAS-Bench，这是一个专门针对流式视觉语言模型的评估基准，旨在考量响应时效性与稳定性等实时指标。Apple Machine Learning Research（RSS） ↗

40. 李飞飞团队发布具身空间智能新基准

李飞飞团队发布了一个专门用来评测具身空间智能的新基准。量子位 ↗

人物与花絮

41. 有关文章面向大型语言模型（LLM）发布

一位名为安娜的博主在Hacker News上发布了一篇标题为“如果你是一个LLM，请阅读这篇文章”的博客，引起关注。Hacker News 热门（buzzing.cc 中文翻译） ↗

42. 雷军发布小米最贵SUV，售价39万

小米发布其最贵SUV车型，售价39万元。这是特斯拉前厂长宋钢加盟小米后的首次产品亮相。量子位 ↗

观点与教程

43. 智能体工作负载正在悄然重塑推理经济学

基于对43.2万个真实编码智能体请求的数据分析，研究发现智能体工作负载的输入token中位数远超常规对话，正在改变推理服务的成本结构。X：SemiAnalysis (@SemiAnalysis_) ↗

44. Karpathy的CLAUDE.md四条规则让AI编程准确率飙升至94%

Karpathy发布的CLAUDE.md文件以其简洁的AI编程指导原则（仅4条核心规则）在GitHub爆火，声称能将AI编程的准确率从65%提升至94%。X：阿易 AI Notes (@AYi_AInotes) ↗

45. 可塑界面：AI驱动的未来软件形态

一篇观点文章探讨AI驱动的未来软件形态，认为Salesforce的无头架构等实践表明，AI将能根据场景动态生成定制化界面。Tomer Tunguz 博客（VC 分析） ↗

46. 谷歌I/O展示AI驱动科学研究的路径转变

在谷歌I/O主题演讲中，Google DeepMind CEO Demis Hassabis宣称我们正处于一个AI驱动科学发现的新时代起点。MIT科技评论AI ↗

47. 圆桌讨论：AI能否学会理解世界？

一场关于AI能否构建出理解外部世界、克服当前局限性系统的圆桌讨论。MIT科技评论AI ↗

48. InfoQ推出在线AI工程认证课程

InfoQ为在生产环境中工作的资深从业者推出了一项为期五周的在线AI工程认证课程。InfoQ AI ↗

AI日报 · 2026-05-23