模型发布/更新

1. Runway发布Aleph 2.0及Edit Studio创作套件

Runway正式推出旗舰视频编辑模型Aleph 2.0及配套的Edit Studio工具,支持最长30秒1080p视频处理,将生成、编辑与后期制作整合于统一平台。Runway:Changelog ↗

2. 腾讯混元开源Hy-MT2多语言翻译模型,1.8B轻量版超越商业API

腾讯开源Hy-MT2系列多语言翻译模型,支持33种语言。其1.8B轻量版性能超越主流商业API,7B与30B版本达到开源SOTA。同步上线“腾讯Hy翻译”小程序。X:腾讯混元 ↗

3. 阿里Qwen3.7-Max模型上线,智能指数位列国产第一

阿里云Qwen3.7-Max模型正式上线API及Qwen Studio。据Artificial Analysis评测,其智能指数达56.6分,位列国产模型第一,全球前五。百炼控制台 ↗

4. 美团开源LongCat-Video-Avatar-1.5音频驱动数字人框架

美团LongCat团队开源音频驱动数字人视频生成框架1.5版,升级Whisper音频编码器以优化唇部动态,并通过蒸馏技术将推理加速至8步。HuggingFace ↗

5. 网易有道开源多模态数学推理模型“子曰4”

网易有道开源专为数学推理设计的“子曰4”模型(Confucius4),基于Qwen3.5-27B,在视觉数理基准上达到SOTA,并将思维链长度减少约43%。HuggingFace ↗

产品与工具

6. OpenAI Codex更新:支持远程操控锁屏Mac,新增多项功能

OpenAI为Codex发布更新,新增允许通过手机远程操控已锁屏Mac的“锁定模式”,以及一键截屏的“Appshots”功能和/goal指令。X:OpenAI Developers ↗

7. OpenAI推出ChatGPT for PowerPoint测试版插件

OpenAI推出ChatGPT for PowerPoint测试版插件,支持在PPT内直接通过对话创建、编辑幻灯片及生成图像,现已面向全球多数用户开放。chatgpt.com ↗

8. Claude Code更新v2.1.147:引入Workflow工具,重命名命令

Claude Code更新至v2.1.147版,引入支持多智能体编排的Workflow工具(默认关闭),将/simplify命令重命名为/code-review,并改进了自动更新器。GitHub Releases ↗

9. Anthropic发布Claude Compliance API及网络安全合作伙伴案例

Anthropic面向企业客户推出Claude Compliance API,并公布Wiz、Palo Alto Networks等安全厂商使用Claude Opus进行自动化渗透测试和威胁分析的早期成果。Claude Blog ↗

10. Datasette Agent:支持对话查询与图表生成的数据助手

Datasette推出其首个AI助手Datasette Agent,提供对话式界面查询数据,并支持通过插件生成图表,是LLM与Datasette整合的重要成果。Simon Willison 博客 ↗

11. PixVerse推出Shoplift:输入产品链接快速生成广告视频

PixVerse发布Shoplift工具,专为DTC团队设计,用户粘贴产品URL即可在几分钟内生成平台原生广告视频,支持持续进行创意测试。X:PixVerse ↗

12. Replit企业版开放自助购买,支持SSO与团队协作

Replit Enterprise现已支持自助服务,用户可在线购买、配置SSO/SCIM并快速开始团队协作开发,无需复杂的合同谈判。X:Replit ↗

13. MiniMax Agent集成Perplexity Search,降低27%成本

MiniMax Agent宣布集成并上线Perplexity AI Search,数据显示该方案较原默认服务总成本降低27%,且通过率提升2%。X ↗

14. CapCut宣布与Gemini App达成集成合作

剪映国际版CapCut宣布正与Gemini App建立合作,用户未来将能在Gemini应用内直接使用CapCut的高级功能编辑图片和视频。X ↗

15. OpenClaw发布2026.5.20更新:新增Discord语音跟随与密钥警告

OpenClaw发布2026.5.20版本更新,新增Discord语音跨频道跟随用户、敏感明文密钥警告提示,并修复了多项安装与登录问题。GitHub ↗

16. 开源Suno技能:一键生成任意风格AI音乐

基于Suno的AI音乐生成技能实现,可通过简单指令生成不同风格的歌曲,已优化近6000个音乐风格检索以提升准确性。X:Vista ↗

开发与工程

17. Google发布ADK for Kotlin与Android 0.1.0,简化AI Agent开发

Google发布面向开发者的新工具包Kotlin版ADK与Android版ADK 0.1.0,旨在帮助开发者在后端或Android应用内更便捷地构建AI Agent。Google Developers Blog ↗

18. Google推出Gemini for Home全栈AI方案,赋能智能家居生态

Google推出集成摄像头智能、自然语言查询和活动摘要的Gemini for Home全栈解决方案,为服务提供商和硬件合作伙伴提供参考设计与API。Google Developers Blog ↗

19. DeepSeek API引入并发限制与user_id隔离

DeepSeek更新API文档,明确deepseek-v4-pro与v4-flash的并发上限,并新增user_id隔离功能,以实现内容安全与KVCache调度隔离。api-docs.deepseek.com ↗

20. SpaceXAI发布Grok Build 0.1模型,专为Agentic Coding打造

SpaceXAI上线专为Agentic Software Engineering设计的Grok Build 0.1模型,并宣布用户可在OpenCode中使用其订阅服务。docs.x.ai ↗

21. Cursor分享构建云端智能体的经验:从架构到可靠性的实践

Cursor团队分享构建云端智能体的经验,强调完整开发环境对输出质量的重要性,并介绍了从自研架构迁移至Temporal平台以提升可靠性的过程。Cursor Blog ↗

22. Grok演示AI深度介入游戏开发:四步流程完成角色动画

Grok展示了通过AI生成角色图、转动画、自动拼接Spritesheet并导入引擎的四步流程,大幅降低游戏开发的美术与动画门槛。X:阿易 AI Notes ↗

行业与公司

23. Anthropic接近盈利,第二季度营收预计达109亿美元

据报道,Anthropic正接近实现其首个盈利季度,预计第二季度营收109亿美元,运营利润5.59亿美元。其增长主要来自编程工具和Claude代理功能。The Decoder:AI News ↗

24. FSD正式进入中国大陆市场

特斯拉完全自动驾驶系统(FSD)正式宣布进入中国大陆市场。X:小互 ↗

25. Intuit裁员超3000人,战略重心转向人工智能

软件公司Intuit宣布裁员超3000人,约占全球员工10%,作为战略重组的一部分,旨在将资源重新聚焦于人工智能领域。Hacker News 热门 ↗

26. 商汤科技连续十年蝉联中国计算机视觉市场第一

根据IDC报告,商汤科技连续十年被评为中国计算机视觉市场第一,其增长得益于CV 2.0架构、海外业务扩展及生成式AI能力的原生嵌入。X:商汤 SenseTime ↗

27. AdventHealth与OpenAI合作,利用AI优化医疗工作流程

美国医疗系统AdventHealth正在采用OpenAI的ChatGPT for Healthcare解决方案,旨在通过处理文档、协调等非临床任务,优化医疗工作流程。OpenAI官网 ↗

28. Cloudflare CEO撰文谈如何决策用AI替代员工

Cloudflare首席执行官在《华尔街日报》撰文,分享其公司用AI替代部分员工的决策逻辑,该文在技术社区引发广泛讨论。Hacker News 热门 ↗

29. 谷歌高管:AI短期内不会摧毁就业市场

谷歌高级副总裁詹姆斯·曼尼卡表示,AI短期内不会摧毁就业市场,他认为自动化将同时导致岗位减少、新增和重新定义,当前争议在于三者比例。IT之家 ↗

30. 分析师:SpaceX S-1文件揭示其成为AI时代企业集团的野心

有VC分析师解读SpaceX S-1文件,认为公司由Starlink、太空业务与AI业务三大板块构成,2025年总营收187亿美元,星链是核心现金引擎。Tomer Tunguz 博客 ↗

31. Modal完成3.55亿美元C轮融资,估值达46.5亿美元

为AI工作负载构建云平台的Modal宣布完成3.55亿美元C轮融资,投后估值46.5亿美元,年化收入已超3亿美元,将重点扩展低延迟推理与Agent计算层。modal.com ↗

32. 消息称月之暗面拆除VIE架构,冲刺赴港IPO

据报道,月之暗面完成新一轮融资后,已通知股东启动拆除VIE及红筹架构,旨在为后续赴港上市做准备。The Verge ↗

33. 首部100% AI生成电影亮相戛纳,计划2026年登陆院线

AI电影项目RAPHAEL在戛纳亮相,全程使用Kling AI视频模型制作,旨在实现独特视觉效果。该项目计划于2026年进行大规模院线上映。X:可灵 Kling AI ↗

34. 京东集团Q4营收利润双创新高,兑现历史最佳财年

京东集团发布财报,第四季度营收与利润均创历史新高,调整后净利润同比增长42.1%,兑现了其历史最佳财年业绩。量子位 ↗

论文与研究

35. OpenAI非数学模型首次自主突破80年未解数学难题

据量子位报道,OpenAI的一个非数学专用模型,首次自主突破了一项困扰数学界80年未解的难题,推演过程长达125页,被形容为“令人恐惧”。量子位 ↗

36. 北大与阿里达摩院AI研究登上《自然》,实现中国风光发电普查

北京大学与阿里达摩院的联合研究登上《自然》杂志,首次利用AI技术实现对中国风光资源的大规模普查,旨在加快“双碳”目标实现。量子位 ↗

观点与教程

37. Gary Marcus:核算OpenAI和Anthropic最新动态背后的数学

AI研究者Gary Marcus分析指出,Claude 3.5 Sonnet在多项基准超越GPT-4o并降价,而Anthropic披露其模型训练成本年均增长约3.2倍。Gary Marcus 博客 ↗

38. 风行在线CEO:AI会放大“自嗨”,解药只有交付结果

风行在线CEO易正朝在AIGC2026峰会上表示,AI会放大“自嗨”问题,企业应用AI的解药在于专注于交付可衡量的结果。量子位 ↗

39. 加州州长签署行政令,应对AI可能带来的劳动力市场冲击

加州州长纽森签署行政令,首次将AI引发的失业问题列为公共政策议题,要求各部门研究遣散费、就业保险等保障措施,并计划建立劳动力数据看板。X:Rohan Paul ↗