引言
今日AI领域迎来模型密集发布潮,Grok、Ideogram、MiniMax等多家推出重磅更新;产品与应用层面,Meta、xAI、Kimi等加速Agent落地;资本端ChatGPT月活破10亿,Suno获4亿美元融资。
模型与能力
1. Grok Imagine 1.5 预览版发布,可于 API 体验
Grok Imagine 1.5 预览版发布,即日起可通过 API 体验,SpaceXAI 持续发力。X:cb_doge (@cb_doge) ↗
2. Ideogram v4.0 发布:原生 2K 分辨率与 JSON 提示支持
Ideogram v4.0 带来原生 2K 分辨率、出色文字渲染与 JSON 提示词支持,可在 Krea 中体验。X:Krea AI (@krea_ai) ↗
3. MiniMax M3 1M token 解码加速 15.6 倍
MiniMax M3 在 1M token 场景下解码加速 15.6 倍,由 FireworksAI_HQ 提供推理支持。X:MiniMax (@MiniMax_AI) ↗
4. Miso One 开源语音模型:8B 参数、110ms 延迟、一次语音克隆
Miso One 发布开源权重语音模型,8B 参数,推理延迟 110ms,支持一次语音克隆,模型权重已开源至 GitHub,无需 API 可自托管。X:Kim (@kimmonismus) ↗
5. Google发布Gemma 4 12B原生多模态模型
Gemma 4 12B采用无编码器架构支持原生音视频输入,可在16GB内存笔记本本地运行多模态Agent,已开源。blog.google:Blog ↗
6. Ideogram发布开源图像模型Ideogram 4.0
Ideogram 4.0参数量9.3B,支持结构化JSON提示词和边界框布局控制,多语言文本渲染领先,开源权重非商用许可。ideogram.ai:Blog ↗
7. Nex AGI发布并开源Nex-N2-Pro模型
基于Qwen3.5后训练,具备自适应推理能力,性能媲美前沿模型,硅基流动限时免费调用。Hugging Face ↗
8. OpenAI升级生命科学模型GPT-Rosalind
整合GPT-5.5的agentic coding与工具使用能力,多项基准领先,向全球合格机构开放研究预览。OpenAI ↗
9. Reve发布Reve 2.0图像模型
号称世界最佳4K图像模型,支持精确布局控制和图像编辑,已上线。X:reve (@reve) ↗
10. 卧安机器人OneModel 1.7用隐式通路打通具身智能断层
在潜在空间中完成信息传导。量子位 ↗
11. 世界模型榜首易主!跨维智能登顶WorldArena
该条目暂无摘要。量子位 ↗
产品与应用
12. Meta 面向 WhatsApp Business 的 AI 智能体现已全球上线
Meta 为 WhatsApp Business 打造的 AI 智能体面向全球商家开放,按模型 token 使用量收费。TechCrunch:AI(RSS) ↗
13. NousResearch 发布 Hermes Agent 桌面应用公测版
官方 Hermes Agent 桌面应用现已推出公测版。X:硅基流动 SiliconFlow (@SiliconFlowAI) ↗
14. Replit 上线 SEO Agent 助应用被发现
Replit 推出 SEO Agent,可为应用运行扫描并建议修复措施,帮助在网页搜索和 AI 搜索中被发现。X:Replit (@Replit) ↗
15. xAI Grok 语音模型上线 Vapi 平台
xAI 的 Grok STT 和 TTS 已在企业语音 AI 平台 Vapi 上线,支持在 Vapi 上构建自定义语音智能体。X:xAI (@xai) ↗
16. Kimi推出本地Agent产品Kimi Work Beta版
基于Kimi Code,支持最多300个子Agent并行协作,Mac版已开放下载,Windows版即将上线。微信公众号 ↗
17. QoderWork升级高校福利:师生认证额外获4000积分
完成认证后累计可获6000积分,教师审核后自动发放,学生手动领取。微信公众号 ↗
18. Google Labs发布Dreambeans:利用Google数据生成生活故事
实验性AI应用,连接Gmail、Calendar数据每日生成个性化故事,仅限美国Google AI Ultra订阅用户。blog.google:Blog ↗
19. OpenAI计划将Codex核心能力整合进ChatGPT
未来几周内整合,用户无需切换产品即可多平台调用Agent,ChatGPT升级为统一工作界面。OpenAI ↗
20. 一个GPT Plus会员费可让机器人跑一个月世界模型
成本仅需150元。量子位 ↗
21. 千问向第三方Agent和Skill全面开放并开启首批测试
瑞幸咖啡、肯德基等企业正在测试,未来所有企业可运营自定义品牌Agent。微信公众号 ↗
22. 扣子3.0实测:手机可远程遥控电脑Agent
桌面、电脑、手机三端打通。量子位 ↗
23. 豆包计划推出专业版,辟谣降体验推会员传闻
豆包官方宣布计划推出专业版,满足专业人群高级需求;基础功能继续免费,辟谣降体验逼买会员说法。微信公众号 ↗
24. Azure Logic Apps 为智能体工作流添加沙箱代码解释器
Microsoft 在 Azure Logic Apps 中增加沙箱代码解释器,支持 Python、JavaScript、C#、PowerShell 在 Hyper-V 隔离会话中运行,可逐工作流选择模型。InfoQ AI ↗
25. Claude Code 新增动态工作流以协调并行智能体
Anthropic 为 Claude Code 引入 Dynamic Workflows,可动态创建编排脚本、拆分子任务、并行执行并验证结果。InfoQ AI ↗
26. Cloudflare 新增对 Claude Managed Agents 的支持
开发者可在 Cloudflare 内运行和管理 Claude 智能体,连接私有系统、选择运行时环境并使用 Cloudflare 服务监控。InfoQ AI ↗
27. 用智能体 AI 重新人性化全球医疗
全球医疗面临长期投资不足和人员短缺,智能体 AI 有望缓解压力,改善护理可及性和员工负担。MIT科技评论AI ↗
开发与基础设施
28. OpenClaw 2026.6.1 发布:新增 Windows 节点与技能工坊
OpenClaw 2026.6.1 上线,新增原生 Windows 节点主机、技能工坊、工作板编排,支持 MiniMax M3。X:OpenClaw (@openclaw) ↗
29. OpenShell v0.0.55 发布:新增 Vertex AI 推理支持
NVIDIA OpenShell v0.0.55 新增 Google Vertex AI 推理提供者、基于配置文件的策略可见性、Podman 检测改进等。X:NVIDIA AI (@NVIDIAAI) ↗
30. Grok 模型登陆 Cloudflare AI Gateway
Grok 模型现已在 Cloudflare 的 AI Gateway 上可用。X:xAI (@xai) ↗
31. Reachy Mini 添加 MCP 工具
推出公开 MCP canary Space,支持远程工具调用。Hugging Face:Blog(RSS) ↗
32. Codex宣布重置所有付费套餐使用额度
针对过去24小时影响可靠性的事件,Codex负责人Tibo宣布重置所有付费套餐额度作为补偿。X:thsottiaux (@thsottiaux) ↗
33. MiniMax优化M3模型速度并开启Token Plan退款
优化GPU推理服务,周五前购买Token Plan用户获M3周限额永久额外50%;控制台开放退款通道。MiniMax:Docs ↗
34. OpenAI调整Codex验证规则,服务端现429故障
疑似取消强制手机二次验证,灰度测试Passkey;服务端大规模故障,Codex和API频繁报错。OpenAI ↗
35. OpenClaw更新:新增Skill Workshop与原生Windows支持
2026.6.1版本引入Skill Workshop,支持Agent复用技能;正式支持原生Windows节点,集成MiniMax M3模型。openclaw.ai:Blog ↗
36. 京东开源JoyAI-Echo长音视频生成框架
支持生成5分钟连贯音视频,跨模态记忆库技术保持角色一致性,速度提升7.5倍,代码与权重开源(仅限学术非商业)。GitHub ↗
37. 讯飞上线星辰Token Plan包月订阅服务
支持多款旗舰模型与讯飞核心能力统一调用,高峰不限流,最高500万TPM吞吐,三档套餐限时促销。微信公众号 ↗
38. 英博数科亮相 CCIG 2026,首次公开 EBFlex 私有化算力管理平台
聚焦高校科研算力需求。量子位 ↗
39. AI 辅助迁移工具助团队数分钟内从 ingress-nginx 迁移至 Higress
CNCF 报道 AI 辅助方法,工程师约 30 分钟迁移 60 个 ingress 资源,展示 AI 在 Kubernetes 网络和网关现代化中的应用。InfoQ AI ↗
40. GitHub 通过每日审计和 MCP 剪枝将智能体工作流 Token 成本降低 62%
GitHub 通过修剪未用 MCP 工具、将部分 MCP 调用替换为 gh CLI、运行审计和优化智能体,使 Token 成本降低达 62%。InfoQ AI ↗
41. DuckDB Quack:基于 HTTP 的客户端/服务器协议用于多用户分析
DuckDB 发布 Quack 远程协议,允许多个实例通过网络连接同一数据库,引入客户端-服务器能力。InfoQ AI ↗
42. Meta 如何重建 PB 级数据摄入以提升可靠性
Meta 工程团队分享迁移 MySQL 社交图数据摄入平台的经验,使用反向影子测试和持续校验和监控实现零停机。InfoQ AI ↗
公司与资本
43. Qwen Cloud 全球 AI 黑客马拉松启动
首届 Qwen Cloud 全球 AI 黑客马拉松启动,设 5 大赛道,总奖金超 7 万美元,冠军 1 万美元。X:阿里云 / Alibaba Cloud (@alibaba_cloud) ↗
44. Sensor Tower:ChatGPT 月活破 10 亿,史上最快
Sensor Tower 估计 ChatGPT 全球月活跃用户 2025 年 5 月突破 10 亿,成为最快达此里程碑的应用。Claude 月活达 5600 万,同比增长约 640%。IT之家(RSS) ↗
45. Suno 完成 4 亿美元 D 轮融资
Suno 宣布完成 4 亿美元 D 轮融资,估值 54 亿美元,使命是让更多人体验音乐制作。X:Suno (@suno) ↗
46. 消息称 DeepSeek 首轮融资拟筹资 500 亿元,腾讯、宁德时代参投
DeepSeek 计划首轮融资约 500 亿元人民币,投后估值预计 3500-4000 亿元,创始人梁文峰出资 200 亿元,腾讯、宁德时代分别拟投 100 亿和 50 亿。IT之家(RSS) ↗
47. 宏利香港与阿里云达成 AI 战略合作
宏利香港与阿里云建立战略合作,共同推进负责任 AI 创新及业务部署。X:阿里云 / Alibaba Cloud (@alibaba_cloud) ↗
48. 微软与 OpenAI 分道扬镳,双方准备正面交锋
微软与 OpenAI 合作关系彻底破裂,转为直接竞争。微软 AI 主管 Mustafa Suleyman 表示微软需证明自身能力。The Verge:订阅版科技(RSS) ↗
49. 黄仁勋与纳德拉共议智能体 AI 时代
NVIDIA 黄仁勋与微软 Satya Nadella 在 MSBuild 共同展示智能体 AI 合作,从 Windows 设备到 AI 工厂。X:NVIDIA (@nvidia) ↗
50. Suno官宣获得超4亿美元D轮融资
投后估值54亿美元,计划数月内推出与音乐产业合作的首个音乐模型。suno.com:Blog ↗
51. Google被曝向开发者付费购买代码库训练AI
通过Play Store联系Android开发者,付费获取私有代码库用于训练AI和改进开发工具,试点阶段。neowin.net ↗
52. A股账户可以买 Robotaxi 了
Robotaxi 双雄同日官宣相关进展。量子位 ↗
53. 戴盟机器人获亿元融资,阿里通义多模态专家加盟攻关物理世界模型
旨在摆脱视觉内卷。量子位 ↗
54. 比亚迪与中国石化深化战略合作 共建智慧能源生态
该条目暂无摘要。量子位 ↗
55. Google I/O 展示 AI 驱动科学的路径正在转变
DeepMind CEO Demis Hassabis 在 I/O 上称我们正站在“奇点山脚”,谷歌展示 AI 在科学发现中的新方向。MIT科技评论AI ↗
政策与安全
56. 欧盟公布全面技术主权计划,推动芯片与 AI 自主发展
欧盟计划扩大本土半导体、AI 和云计算供应链,减少对美亚依赖,覆盖芯片制造、AI 基础设施等领域。Bloomberg:Technology(RSS) ↗
57. 美国发布AI安全新规:鼓励发布前自愿受检,不设强制许可
行政命令建立自愿审查框架,开发商可在公开发布前最多30天提交政府评估,同时升级关键基础设施网络防御。whitehouse.gov ↗
58. Google Search允许网站不被AI Overviews收录
应英国反垄断机构要求,在Search Console测试新控件,允许网站屏蔽生成式AI搜索使用,后续全球推广。blog.google:Blog ↗
59. OpenAI发布前沿AI治理蓝图,CEO赴华盛顿探讨公私合作
提议建立联邦安全框架,Sam Altman推动AI监管合作及向消费者分享AI经济收益机制。OpenAI ↗
60. Arm 开源 Metis——超越传统 SAST 的 AI 安全框架
Metis 是自主发现复杂软件漏洞的智能体安全框架,运用语义推理分析跨组件依赖,并给出自然语言解释。InfoQ AI ↗
61. BadHost 漏洞暴露 AI 智能体、评估器和 LLM 网关
Python Web 框架 Starlette 的高危认证绕过漏洞,可让攻击者利用畸形 Host 头绕过路径访问控制,危及 AI 基础设施。InfoQ AI ↗
62. 教皇《Magnifica Humanitas》为个人应对 AI 时代提供模板
教皇通谕强调“技术从不中立”,呼吁人们勇敢团结地进入 AI 变革时代。MIT科技评论AI ↗
论文与研究
63. Anthropic 分析 832 个 AI 恶意账户:中高风险攻击者半年从 33% 跃至 56%
Anthropic 分析 2025.03-2026.03 间 832 个被封禁恶意账户,67.3% 用 AI 编写恶意软件,中高风险攻击者占比从 33% 升至 56%。Anthropic:Research(发表成果 · 网页) ↗
64. NVIDIA Research 在 CVPR 2026 发表三篇论文:抓取、自动驾驶与智能体泛化
NVIDIA Research 在 CVPR 2026 发表 GraspGen-X(零样本抓取)、LCDrive(紧凑表示自动驾驶)和 NitroGen(具身智能体训练)等论文,并发布相关工具。NVIDIA AI Blog ↗
65. 微软研究:装瓶厂 AI 从聊天到决策
微软在中西部装瓶厂三个月试点显示 AI 超越聊天进入决策领域时的实际效果。X:Microsoft Research (@MSFTResearch) ↗
66. 斯坦福大学法学院研究:人工智能表现优于法学教授
斯坦福大学法学院研究表明 AI 表现优于法学教授,引发广泛关注。Hacker News 热门(buzzing.cc 中文翻译) ↗
观点与教程
67. Anthropic 用 Claude 赋能自助数据分析
Anthropic 使用 Claude 自动化 95% 业务分析查询,准确率约 95%,通过智能体分析栈解决实体歧义、数据过时和检索失败。Claude:Blog(网页) ↗
68. Karpathy 的 llm-wiki 项目获超五千星
Karpathy 的 llm-wiki 项目获 5000+ 星,理念是用大模型构建并维护维基,每次使用更智能。X:硅基流动 SiliconFlow (@SiliconFlowAI) ↗
69. 优步每月 1500 美元 AI 使用上限为工具定价提供参考
优步将 AI 工具月使用上限设为 1500 美元,为行业定价提供信号。Hacker News 热门(buzzing.cc 中文翻译) ↗
70. 智能体工程实战窍门全录
分享“智能体工程”如何重塑软件开发:人主导方向、智能体执行,核心是 plan.md 约束,22 条实战技巧涵盖规划、并行、输入方式等。X:邵猛 (@shao__meng) ↗
71. Google 开源水文建模框架,助力洪水韧性
Google Research 开源基于 PyTorch 的水文建模框架,采用 Flood Hub 相同架构,允许研究者训练 AI 洪水预报模型,已与捷克气象所合作测试。Google Research:Blog(网页) ↗
72. 世界模型的功能分类
World Labs 与李飞飞发文梳理“世界模型”概念,基于 POMDP 框架将不同系统归为渲染器类,强调概念分层而非具体模型或分数。X:Fei-Fei Li (@drfeifei, World Labs) ↗
73. 超越聊天机器人的直接偏好优化
Dharma-AI 发文探讨 DPO 在聊天机器人之外的广泛应用场景。Hugging Face:Blog(RSS) ↗
74. LeCun押注隐空间世界模型,视觉大模型团队已布局
隐空间世界模型虽难,但团队坚持研发。量子位 ↗
75. 文章:为什么纯向量搜索不够——RAG 的混合检索
作者讨论纯向量搜索 RAG 管道的局限,介绍使用 Reciprocal Rank Fusion 结合 BM25 和向量结果的混合搜索方案。InfoQ AI ↗
76. 李飞飞亲自定义世界模型
渲染、模拟、规划三大功能边界正在消融。量子位 ↗
77. 在智能体 AI 时代重新思考组织设计
85% 组织希望在三年内实现智能体化,但 76% 认为当前运营和基础设施无法支持,人员、流程和工作流均不成熟。MIT科技评论AI ↗
78. 文章:导致 Spark 在 Kubernetes 上 OOM 的两个配置错误
迁移到 Azure Kubernetes Service 后,tmpfs 与硬 podAffinity 规则交互导致重复 OOM 杀死,标准诊断无法发现。InfoQ AI ↗
79. 文章:测试自动化中的 AI 生产力悖论——超越结构验证到感知与意图
AI 会放大所基于的抽象层;若抽象层结构性脆弱,则放大脆弱性。文章主张摒弃以 DOM 为中心的抽象,转向基于感知与意图的测试范式。InfoQ AI ↗
80. 演讲:如何选择 AI 副驾以最大化开发者生产力
Sepehr Khosravi 评估 Cursor、Claude Code 等工具,介绍上下文工程、自定义规则和 MCP 集成的实用技巧及基准。InfoQ AI ↗
81. 演讲:构建 AI 采纳的评估——从原则到实践
Mallika Rao 讨论生产 AI 系统中的评估债务,提出五层评估堆栈和诊断成熟度模型,帮助工程领导消除语义失败。InfoQ AI ↗
82. 演讲:设计可靠 AI 平台——确定性工具与探索性智能体
Aaron Erickson 讲解如何将确定性软件护栏与智能体探索结合,优化智能体层级,利用时间序列基础模型,实施严格评估金字塔。InfoQ AI ↗
83. AI 时代规模化创造力
技术一直融入叙事媒介,AI 正在改变故事创作与分发的格局。MIT科技评论AI ↗
84. AI 炒作指数:毕业季 AI 遭遇嘘声
前谷歌 CEO Eric Schmidt 在亚利桑那大学演讲中呼吁毕业生塑造 AI,却遭全场嘘声。MIT科技评论AI ↗
85. 圆桌:AI 能学会理解世界吗?
讨论世界模型的最新发展,如何让 AI 超越 LLM 局限,理解外部世界。MIT科技评论AI ↗
86. 对 AI 工作恐慌的现实检查
尽管有裁员新闻,但 AI 尚未导致大规模失业,入门级工作面临风险更值得关注。MIT科技评论AI ↗
87. 小企业如何利用 AI
从会计到设计、市场研究等,AI 可帮助小企业覆盖广泛技能需求,文章探讨实际应用方法。MIT科技评论AI ↗
88. 解决入门级工作的潜在危机已刻不容缓
AI 尚未导致总体就业数字剧变,但职业阶梯第一级正在弱化,需引起注意。MIT科技评论AI ↗
人物与动态
89. Satya Nadella 谈微软 Build 大会主旨演讲
Satya Nadella 在 Microsoft Build 上分享共同构建前沿智能生态系统的亮点。X:Satya Nadella (@satyanadella) ↗
今日脉络
-
多模态与语音模型集中亮相 Grok Imagine 1.5 预览版发布,可于API体验;Ideogram v4.0 支持原生2K分辨率与JSON提示;Miso One 开源8B语音模型,推理延迟仅110ms;MiniMax M3 在1M token场景下解码加速15.6倍。
-
产品应用与资本动态 Meta 面向 WhatsApp Business 的AI智能体全球上线;Kimi推出本地Agent产品Kimi Work Beta;ChatGPT月活破10亿创纪录;Suno完成4亿美元D轮融资,估值54亿美元;DeepSeek拟首轮融资500亿元。
-
开源与基础设施持续进化 Google开源Gemma 4 12B原生多模态模型;Ideogram开源9.3B图像模型;京东开源JoyAI-Echo长音视频生成框架;OpenClaw新增Windows节点与技能工坊;GitHub通过审计与MCP剪枝将Agent Token成本降低62%。
总结
今日AI领域呈现模型创新与商业落地双轮驱动:多模态、语音模型性能突破,Agent产品从开发工具走向行业应用。开源生态持续壮大,同时资本加码头部项目。开发者可关注新模型API与开源权重,企业应评估Agent工作流与成本优化策略。
评论 (0)
发表评论
请先登录后发表评论