模型发布/更新
1. 首个基于华为昇腾910B全栈训练的1.58比特开源模型BitCPM-CANN发布
ModelBest、清华大学与OpenBMB社区联合发布全球首个完全基于华为昇腾910B NPU训练的开源1.58比特三元大模型BitCPM-CANN,其极低比特量化技术能显著降低模型内存占用。X:Rohan Paul (@rohanpaul_ai) ↗
2. 智谱发布高速版旗舰模型GLM-5.1-HighSpeed,速度达400 tokens/s
智谱发布了旗舰模型GLM-5.1的高速版本API“GLM-5.1-HighSpeed”,官方称在保留原模型能力下速度达400 tokens/s,目前仅面向部分企业客户开放。微信文章 ↗
3. 阿里云百炼上线旗舰模型Qwen3.7-Max并提供限时优惠
阿里巴巴最新旗舰模型Qwen3.7-Max已接入千问多端供免费体验,同时阿里云百炼针对该模型提供限时五折优惠。微信文章 ↗
4. 网易有道推出14语言零样本语音克隆引擎Confucius4-TTS
网易有道推出Confucius4-TTS,支持14种语言的零样本声音克隆与跨语言合成,据称3秒即可复刻原声且准确度超97%。模型权重即将开源。huggingface.co ↗
产品与工具
5. DeepSeek将V4-Pro API优惠转为永久定价
DeepSeek宣布将
DeepSeek-V4-Pro模型API现有的2.5折优惠转为永久定价,此价格将于原定5月31日优惠结束后正式生效。api-docs.deepseek.com ↗
6. 谷歌I/O发布AI代理全套开发工具链,包括Antigravity 2.0
谷歌在I/O开发者大会宣布系统性构建面向AI代理的开发与部署工具链,核心更新包括独立桌面应用Antigravity 2.0及其命令行工具、SDK,以及AI Studio新增Kotlin支持。X:Google AI (@GoogleAI) ↗
7. Antigravity大幅更新:翻倍上下文长度,配额提至九倍
Antigravity发布重大更新,将Gemini 3.5 Flash最大上下文长度翻倍,付费订阅每周Gemini配额提至九倍并重置额度,同时新增IDE打开按钮并修复了Windows故障。X ↗
8. Claude Code的自动模式面向Pro用户开放,支持新模型
Claude Code的自动模式现已面向Pro订阅用户开放,并新增对Sonnet 4.6和Opus 4.7模型的支持。用户可通过Shift+Tab组合键启动。X:Claude Devs (@ClaudeDevs) ↗
9. Warp向免费用户开放BYOK功能,支持自定义端点
终端工具Warp宣布向免费计划用户开放自带模型密钥功能,并全面支持兼容OpenAI Chat Completions API的自定义推理端点。docs.warp.dev ↗
10. TRAE中国版上线Kimi模型原生视频理解能力
TRAE中国版内置的Kimi-K2.6和Kimi-K2.5模型现已上线原生视频理解能力,可让Agent直接看懂并解析视频内容。微信文章 ↗
11. OpenAI Codex /goal功能正式发布及使用指南
OpenAI宣布Codex的/goal模式结束实验成为稳定功能。用户可在Codex应用、IDE扩展或CLI中使用,通过设定具体里程碑让AI持续工作直至完成。X:宝玉 (@dotey) ↗
12. OpenAI测试ChatGPT简化版模型选择器
OpenAI正在ChatGPT网页端测试名为“Intelligence”的简化版模型选择器,将原有的模型与推理档位精简为四个选项,允许用户恢复常用设置。X ↗
13. DeepSeek V4 Flash登顶OpenRouter周排行榜
在OpenRouter平台,DeepSeek V4 Flash模型已登顶周排行榜。X:OpenRouter (@OpenRouter) ↗
14. xAI发布Grok Skills并更新工具调用API
xAI发布了Grok Skills以及针对Grok 4.3的Responses API增强功能,支持持久化自定义体验和更强大的工具调用。InfoQ AI ↗
15. Gemini Omni发布,创意作品涌现
Gemini Omni发布后,社区涌现出许多令人惊叹的创作作品。X:Gemini (@GeminiApp) ↗
16. Viggle AI使动作捕捉与角色动画制作更轻松
Viggle AI称其工具让动作捕捉和角色动画制作变得前所未有的简单,并承诺将推出更多功能。X:Viggle AI (@ViggleAI) ↗
17. ChatGPT语音模式实现表单语音填写
借助ChatGPT的图像功能和语音模式,用户可以上传表单,通过语音说出要填写的内容,即可获得填写完成的版本。X:ChatGPT (@ChatGPTapp) ↗
18. Project Genie与谷歌街景合作推出交互式世界
Google DeepMind的Project Genie与谷歌地图街景合作,现在可以将真实的美国地点转化为全新的交互式世界。X:Google DeepMind (@GoogleDeepMind) ↗
19. Suno AI创作夏日神曲《波多黎各》爆火
由Suno AI创作的歌曲《Puerto Rico》成为夏日热门歌曲,并通过媒体GMA的报道获得更广泛传播。X:Suno (@suno) ↗
开发与工程
20. Perplexity开源供应链安全扫描工具Bumblebee
Perplexity宣布开源内部安全工具Bumblebee,这是一款适用于macOS和Linux的只读扫描器,可检查开发者机器上的高风险软件包和配置。GitHub ↗
21. Cloudflare完成智能体基础设施栈,重建Browser Run
Cloudflare在其自有Containers平台上重建了Browser Run,实现了4倍更高的并发和50%更快的响应速度,完善了其智能体基础设施栈。InfoQ AI ↗
22. Kakuna:一款将原型代码自动加固为生产级代码的AI代理工具
Kakuna是一款AI代理工具,旨在将早期快速原型自动转化为可维护的生产级代码库,通过模拟人类流程自动执行代码审查、测试补充等工作。X:swyx (@swyx) ↗
23. OpenAI新增差异标记样式设置选项
OpenAI在开发者工具的外观设置中新增了差异标记样式选项,允许用户在查看代码差异时选择经典的+/-标记。X:OpenAI Developers (@OpenAIDevs) ↗
24. Discord如何用自动化框架管理海量ScyllaDB数据库
Discord详细介绍了其如何围绕一个新的内部编排框架重建数据库运维,以管理其规模庞大的ScyllaDB集群。InfoQ AI ↗
25. AI原生工程实践分享:Meta Reality Labs案例
Meta Reality Labs的Ian Thomas分享了一个拥抱AI原生工程的案例,介绍了“评估与采用”等实践方法。InfoQ AI ↗
26. Uber使用实时信号和列表排名改进餐厅推荐
Uber更新了其Uber Eats首页推荐系统,使用了近实时用户序列特征和生成式列表排名技术。InfoQ AI ↗
行业与公司
27. DeepSeek推进700亿元巨额融资,承诺坚持开源路线
AI公司DeepSeek正推进约700亿元人民币的融资,估值达450亿美元。创始人梁文锋承诺将继续开源开发AI模型,不追求短期商业化,目标指向技术升级与通用人工智能。IT之家(RSS) ↗
28. Cursor被评为2026年Gartner企业级AI编码代理魔力象限领导者
Gartner在2026年魔力象限报告中,将Cursor评为企业级AI编码代理领域的领导者,并在愿景完整性上领先。超过70%的财富500强企业使用Cursor。Cursor Blog ↗
29. GitHub连续第三年被Gartner评为企业级AI编程代理领导者
Gartner最新魔力象限报告将GitHub连续第三年列为“领导者”象限,该评估专注于企业级AI编程代理领域。GitHub Blog ↗
30. OpenAI被Gartner评为企业AI编码代理领域领导者
Gartner发布2026年企业AI编码代理魔力象限报告,OpenAI被列为领导者,其产品Codex因技术创新和企业级部署表现获得认可。OpenAI:官网动态(RSS · 排除企业/客户案例) ↗
31. 英伟达财报亮眼,黄仁勋预测AI基建年开支将冲4万亿美元
英伟达发布2027财年Q1财报,营收816亿美元,同比增长85%。黄仁勋预测,超大规模云厂商的AI基建年度开支将从1万亿美元增长至3-4万亿美元。IT之家(RSS) ↗
32. 有关部门正推进国产大模型适配国产算力芯片
据报道,有关部门表示正指导国产大模型适配国产算力芯片,并谋划出台加快“人工智能+”落地配套文件,推动央国企开放应用场景。ndrc.gov.cn ↗
33. 深圳AI公司狂揽F轮融资,用户达4100万
一家深圳的AI公司狂揽F轮融资,用户数量达到4100万,其产品致力于将企业旧系统变成AI能力库。量子位 ↗
34. 80集短剧3天拍完:影视Agent如何提效数十倍
一家影视公司利用AI Agent将80集短剧的拍摄时间缩短至3天,提效数十倍的同时Token消耗直降70%。量子位 ↗
35. 联想集团第四季度营收利润双创新高
联想集团公布第四季度及全年财报,营收利润双创新高,调整后净利润同比增长42.1%,兑现历史最佳财年。量子位 ↗
论文与研究
36. Anthropic公布Project Glasswing进展:AI已发现超万高危漏洞
Anthropic公布Project Glasswing项目进展,宣称其Claude Mythos Preview模型已在关键软件及开源项目中发现超一万个高危或严重漏洞。Anthropic:Newsroom(网页) ↗
37. Google DeepMind发布AlphaProof Nexus数学证明框架
Google DeepMind推出AlphaProof Nexus框架,通过结合大型语言模型与Lean编译器进行数学形式化证明搜索,相关结果与代码已公开。arxiv.org ↗
38. 图灵测试76年后首现实证:GPT-4.5以73%判定率超越真人
加州大学圣地亚哥分校研究首次实证现代AI可通过图灵测试。研究表明,GPT-4.5在特定提示下被误认为人类的概率高达73%,显著超过真人。IT之家(RSS) ↗
39. VSAS-Bench:面向视觉流式辅助模型的实时评估基准
研究团队提出了VSAS-Bench,这是一个专门针对流式视觉语言模型的评估基准,旨在考量响应时效性与稳定性等实时指标。Apple Machine Learning Research(RSS) ↗
40. 李飞飞团队发布具身空间智能新基准
李飞飞团队发布了一个专门用来评测具身空间智能的新基准。量子位 ↗
人物与花絮
41. 有关文章面向大型语言模型(LLM)发布
一位名为安娜的博主在Hacker News上发布了一篇标题为“如果你是一个LLM,请阅读这篇文章”的博客,引起关注。Hacker News 热门(buzzing.cc 中文翻译) ↗
42. 雷军发布小米最贵SUV,售价39万
小米发布其最贵SUV车型,售价39万元。这是特斯拉前厂长宋钢加盟小米后的首次产品亮相。量子位 ↗
观点与教程
43. 智能体工作负载正在悄然重塑推理经济学
基于对43.2万个真实编码智能体请求的数据分析,研究发现智能体工作负载的输入token中位数远超常规对话,正在改变推理服务的成本结构。X:SemiAnalysis (@SemiAnalysis_) ↗
44. Karpathy的CLAUDE.md四条规则让AI编程准确率飙升至94%
Karpathy发布的CLAUDE.md文件以其简洁的AI编程指导原则(仅4条核心规则)在GitHub爆火,声称能将AI编程的准确率从65%提升至94%。X:阿易 AI Notes (@AYi_AInotes) ↗
45. 可塑界面:AI驱动的未来软件形态
一篇观点文章探讨AI驱动的未来软件形态,认为Salesforce的无头架构等实践表明,AI将能根据场景动态生成定制化界面。Tomer Tunguz 博客(VC 分析) ↗
46. 谷歌I/O展示AI驱动科学研究的路径转变
在谷歌I/O主题演讲中,Google DeepMind CEO Demis Hassabis宣称我们正处于一个AI驱动科学发现的新时代起点。MIT科技评论AI ↗
47. 圆桌讨论:AI能否学会理解世界?
一场关于AI能否构建出理解外部世界、克服当前局限性系统的圆桌讨论。MIT科技评论AI ↗
48. InfoQ推出在线AI工程认证课程
InfoQ为在生产环境中工作的资深从业者推出了一项为期五周的在线AI工程认证课程。InfoQ AI ↗
评论 (0)
发表评论
请先登录后发表评论