模型发布/更新
1. Runway发布Aleph 2.0及Edit Studio创作套件
Runway正式推出旗舰视频编辑模型Aleph 2.0及配套的Edit Studio工具,支持最长30秒1080p视频处理,将生成、编辑与后期制作整合于统一平台。Runway:Changelog ↗
2. 腾讯混元开源Hy-MT2多语言翻译模型,1.8B轻量版超越商业API
腾讯开源Hy-MT2系列多语言翻译模型,支持33种语言。其1.8B轻量版性能超越主流商业API,7B与30B版本达到开源SOTA。同步上线“腾讯Hy翻译”小程序。X:腾讯混元 ↗
3. 阿里Qwen3.7-Max模型上线,智能指数位列国产第一
阿里云Qwen3.7-Max模型正式上线API及Qwen Studio。据Artificial Analysis评测,其智能指数达56.6分,位列国产模型第一,全球前五。百炼控制台 ↗
4. 美团开源LongCat-Video-Avatar-1.5音频驱动数字人框架
美团LongCat团队开源音频驱动数字人视频生成框架1.5版,升级Whisper音频编码器以优化唇部动态,并通过蒸馏技术将推理加速至8步。HuggingFace ↗
5. 网易有道开源多模态数学推理模型“子曰4”
网易有道开源专为数学推理设计的“子曰4”模型(Confucius4),基于Qwen3.5-27B,在视觉数理基准上达到SOTA,并将思维链长度减少约43%。HuggingFace ↗
产品与工具
6. OpenAI Codex更新:支持远程操控锁屏Mac,新增多项功能
OpenAI为Codex发布更新,新增允许通过手机远程操控已锁屏Mac的“锁定模式”,以及一键截屏的“Appshots”功能和/goal指令。X:OpenAI Developers ↗
7. OpenAI推出ChatGPT for PowerPoint测试版插件
OpenAI推出ChatGPT for PowerPoint测试版插件,支持在PPT内直接通过对话创建、编辑幻灯片及生成图像,现已面向全球多数用户开放。chatgpt.com ↗
8. Claude Code更新v2.1.147:引入Workflow工具,重命名命令
Claude Code更新至v2.1.147版,引入支持多智能体编排的Workflow工具(默认关闭),将/simplify命令重命名为/code-review,并改进了自动更新器。GitHub Releases ↗
9. Anthropic发布Claude Compliance API及网络安全合作伙伴案例
Anthropic面向企业客户推出Claude Compliance API,并公布Wiz、Palo Alto Networks等安全厂商使用Claude Opus进行自动化渗透测试和威胁分析的早期成果。Claude Blog ↗
10. Datasette Agent:支持对话查询与图表生成的数据助手
Datasette推出其首个AI助手Datasette Agent,提供对话式界面查询数据,并支持通过插件生成图表,是LLM与Datasette整合的重要成果。Simon Willison 博客 ↗
11. PixVerse推出Shoplift:输入产品链接快速生成广告视频
PixVerse发布Shoplift工具,专为DTC团队设计,用户粘贴产品URL即可在几分钟内生成平台原生广告视频,支持持续进行创意测试。X:PixVerse ↗
12. Replit企业版开放自助购买,支持SSO与团队协作
Replit Enterprise现已支持自助服务,用户可在线购买、配置SSO/SCIM并快速开始团队协作开发,无需复杂的合同谈判。X:Replit ↗
13. MiniMax Agent集成Perplexity Search,降低27%成本
MiniMax Agent宣布集成并上线Perplexity AI Search,数据显示该方案较原默认服务总成本降低27%,且通过率提升2%。X ↗
14. CapCut宣布与Gemini App达成集成合作
剪映国际版CapCut宣布正与Gemini App建立合作,用户未来将能在Gemini应用内直接使用CapCut的高级功能编辑图片和视频。X ↗
15. OpenClaw发布2026.5.20更新:新增Discord语音跟随与密钥警告
OpenClaw发布2026.5.20版本更新,新增Discord语音跨频道跟随用户、敏感明文密钥警告提示,并修复了多项安装与登录问题。GitHub ↗
16. 开源Suno技能:一键生成任意风格AI音乐
基于Suno的AI音乐生成技能实现,可通过简单指令生成不同风格的歌曲,已优化近6000个音乐风格检索以提升准确性。X:Vista ↗
开发与工程
17. Google发布ADK for Kotlin与Android 0.1.0,简化AI Agent开发
Google发布面向开发者的新工具包Kotlin版ADK与Android版ADK 0.1.0,旨在帮助开发者在后端或Android应用内更便捷地构建AI Agent。Google Developers Blog ↗
18. Google推出Gemini for Home全栈AI方案,赋能智能家居生态
Google推出集成摄像头智能、自然语言查询和活动摘要的Gemini for Home全栈解决方案,为服务提供商和硬件合作伙伴提供参考设计与API。Google Developers Blog ↗
19. DeepSeek API引入并发限制与user_id隔离
DeepSeek更新API文档,明确deepseek-v4-pro与v4-flash的并发上限,并新增user_id隔离功能,以实现内容安全与KVCache调度隔离。api-docs.deepseek.com ↗
20. SpaceXAI发布Grok Build 0.1模型,专为Agentic Coding打造
SpaceXAI上线专为Agentic Software Engineering设计的Grok Build 0.1模型,并宣布用户可在OpenCode中使用其订阅服务。docs.x.ai ↗
21. Cursor分享构建云端智能体的经验:从架构到可靠性的实践
Cursor团队分享构建云端智能体的经验,强调完整开发环境对输出质量的重要性,并介绍了从自研架构迁移至Temporal平台以提升可靠性的过程。Cursor Blog ↗
22. Grok演示AI深度介入游戏开发:四步流程完成角色动画
Grok展示了通过AI生成角色图、转动画、自动拼接Spritesheet并导入引擎的四步流程,大幅降低游戏开发的美术与动画门槛。X:阿易 AI Notes ↗
行业与公司
23. Anthropic接近盈利,第二季度营收预计达109亿美元
据报道,Anthropic正接近实现其首个盈利季度,预计第二季度营收109亿美元,运营利润5.59亿美元。其增长主要来自编程工具和Claude代理功能。The Decoder:AI News ↗
24. FSD正式进入中国大陆市场
特斯拉完全自动驾驶系统(FSD)正式宣布进入中国大陆市场。X:小互 ↗
25. Intuit裁员超3000人,战略重心转向人工智能
软件公司Intuit宣布裁员超3000人,约占全球员工10%,作为战略重组的一部分,旨在将资源重新聚焦于人工智能领域。Hacker News 热门 ↗
26. 商汤科技连续十年蝉联中国计算机视觉市场第一
根据IDC报告,商汤科技连续十年被评为中国计算机视觉市场第一,其增长得益于CV 2.0架构、海外业务扩展及生成式AI能力的原生嵌入。X:商汤 SenseTime ↗
27. AdventHealth与OpenAI合作,利用AI优化医疗工作流程
美国医疗系统AdventHealth正在采用OpenAI的ChatGPT for Healthcare解决方案,旨在通过处理文档、协调等非临床任务,优化医疗工作流程。OpenAI官网 ↗
28. Cloudflare CEO撰文谈如何决策用AI替代员工
Cloudflare首席执行官在《华尔街日报》撰文,分享其公司用AI替代部分员工的决策逻辑,该文在技术社区引发广泛讨论。Hacker News 热门 ↗
29. 谷歌高管:AI短期内不会摧毁就业市场
谷歌高级副总裁詹姆斯·曼尼卡表示,AI短期内不会摧毁就业市场,他认为自动化将同时导致岗位减少、新增和重新定义,当前争议在于三者比例。IT之家 ↗
30. 分析师:SpaceX S-1文件揭示其成为AI时代企业集团的野心
有VC分析师解读SpaceX S-1文件,认为公司由Starlink、太空业务与AI业务三大板块构成,2025年总营收187亿美元,星链是核心现金引擎。Tomer Tunguz 博客 ↗
31. Modal完成3.55亿美元C轮融资,估值达46.5亿美元
为AI工作负载构建云平台的Modal宣布完成3.55亿美元C轮融资,投后估值46.5亿美元,年化收入已超3亿美元,将重点扩展低延迟推理与Agent计算层。modal.com ↗
32. 消息称月之暗面拆除VIE架构,冲刺赴港IPO
据报道,月之暗面完成新一轮融资后,已通知股东启动拆除VIE及红筹架构,旨在为后续赴港上市做准备。The Verge ↗
33. 首部100% AI生成电影亮相戛纳,计划2026年登陆院线
AI电影项目RAPHAEL在戛纳亮相,全程使用Kling AI视频模型制作,旨在实现独特视觉效果。该项目计划于2026年进行大规模院线上映。X:可灵 Kling AI ↗
34. 京东集团Q4营收利润双创新高,兑现历史最佳财年
京东集团发布财报,第四季度营收与利润均创历史新高,调整后净利润同比增长42.1%,兑现了其历史最佳财年业绩。量子位 ↗
论文与研究
35. OpenAI非数学模型首次自主突破80年未解数学难题
据量子位报道,OpenAI的一个非数学专用模型,首次自主突破了一项困扰数学界80年未解的难题,推演过程长达125页,被形容为“令人恐惧”。量子位 ↗
36. 北大与阿里达摩院AI研究登上《自然》,实现中国风光发电普查
北京大学与阿里达摩院的联合研究登上《自然》杂志,首次利用AI技术实现对中国风光资源的大规模普查,旨在加快“双碳”目标实现。量子位 ↗
观点与教程
37. Gary Marcus:核算OpenAI和Anthropic最新动态背后的数学
AI研究者Gary Marcus分析指出,Claude 3.5 Sonnet在多项基准超越GPT-4o并降价,而Anthropic披露其模型训练成本年均增长约3.2倍。Gary Marcus 博客 ↗
38. 风行在线CEO:AI会放大“自嗨”,解药只有交付结果
风行在线CEO易正朝在AIGC2026峰会上表示,AI会放大“自嗨”问题,企业应用AI的解药在于专注于交付可衡量的结果。量子位 ↗
39. 加州州长签署行政令,应对AI可能带来的劳动力市场冲击
加州州长纽森签署行政令,首次将AI引发的失业问题列为公共政策议题,要求各部门研究遣散费、就业保险等保障措施,并计划建立劳动力数据看板。X:Rohan Paul ↗
评论 (0)
发表评论
请先登录后发表评论