引言
今日 AI 动态集中在模型提速、智能体落地、开发基础设施完善,以及政策与安全边界变化。
模型与能力
1. Google DeepMind 开源 DiffusionGemma,文本生成提速 4 倍
Google DeepMind 发布开源实验模型 DiffusionGemma,采用文本扩散并行生成 256 个 token。该 26B MoE 模型推理仅激活 3.8B 参数,量化后可运行于 18GB 显存 GPU,在 H100 上达 1000+ tokens/s,并支持内联编辑、代码填充等本地工作流。Google DeepMind:Blog(RSS) ↗
2. xAI 称 Grok Voice 性能强且价格更低
xAI 表示 Grok Voice 具备类人的时机、语调和温暖感,并称其价格仅为竞争对手的一小部分。X:xAI (@xai) ↗
3. Claude Fable 5 首日实测出炉
Claude Fable 5 首日测试引发大量关注。量子位 ↗
4. GPT-5.6 首批实测公布,对标 Mythos
GPT-5.6 预计本月发布,首批测试已出现。量子位 ↗
5. HiDream-O1-Image-1.5 登顶文生图榜单
量子位转载智象未来文章称,HiDream-O1-Image-1.5 在文生图榜单中位列中国第一、全球第二,并超过谷歌、英伟达相关模型。量子位 ↗
6. 小米 1T 大模型实测:吞吐量超每秒 1000 Tokens
量子位称,小米最快 1T 大模型可在通用 GPU 上实现每秒 1000+ Tokens 吞吐量,并在 Vibe Coding 场景中七秒交付。量子位 ↗
产品与应用
7. 火山方舟上线版权商业化平台,首批引入周星驰电影 IP
火山引擎上线火山方舟版权商业化平台,提供授权、保护、审核、分发、变现全链路机制。平台搭载 Seedance 2.0,已获得比高集团三部电影在 AI 视频创作场景下的版权使用权,并开放相关创作模板与变现路径。公众号:火山引擎 ↗
8. ChatGPT 推出国旗发色图片玩法
ChatGPT 推出 #MessiMode 图片提示词,可将用户照片中的头发自然变为本国国旗颜色;未提供国家或图片时会先询问。X:ChatGPT (@ChatGPTapp) ↗
9. Magnetar 拟用数百个 AI 智能体做股票研究
Bloomberg 称,对冲基金 Magnetar Capital 的新产品将减少人类分析师参与,依靠数百个 AI 智能体搜索投资想法、研究公司、推荐头寸并预测趋势,人类仍负责批准交易。X:Rohan Paul (@rohanpaul_ai) ↗
10. eToro 智能体 Tori 接入 SpaceXAI 文本模型
eToro 的 AI 智能体 Tori 集成 SpaceXAI 文本模型,可从 X 实时读取市场情绪、追踪信号并支持自然语言查询;该能力基于 SpaceXAI API 构建。xAI:News(网页) ↗
11. 东风联手九识,推出商用无人车“HI模式”
商用车 AI 基座已初步成型。量子位 ↗
12. 抖音招募 AI 视频创作者
抖音面向创作者征集 AI 视频人才。量子位 ↗
开发与基础设施
13. Cursor Bugbot 提速 3 倍并降低代码审查成本
Cursor 更新代码审查工具 Bugbot:运行速度提升超 3 倍,成本降低 22%,每轮多发现 10% bug,并新增 /review 命令,可在推送前执行 Bugbot 与安全审查并同步 GitHub/GitLab。Cursor Blog ↗
14. MiniMax M3 上线 0G,限时免费运行
MiniMax M3 已在 0G 上链,支持可验证与私有计算,并在 6 月 15–18 日限时免费运行。X:MiniMax (@MiniMax_AI) ↗
15. 华为云发布端到端具身 AI 平台 CloudRobo
华为云推出具身 AI 开发平台 CloudRobo,覆盖数据、模型、部署和集成全生命周期,并在 INSPIRE2026 展示数据与模型评估、力控模型组装、机器人上云和模型部署能力。X:华为云 (@HuaweiCloud1) ↗
16. 小米开源终端 AI 编程助手 MiMo Code V0.1
小米发布开源终端 AI 编程助手 MiMo Code V0.1,附带限时免费的 MiMo V2.5,支持百万 token 上下文、Compose 模式、语音输入、兼容 Claude Code,并支持 Anthropic、OpenAI、DeepSeek、Kimi、GLM 等模型提供商。X:小米 MiMo (@XiaomiMiMo) ↗
17. Apache Burr 发布,用于构建可靠 AI 智能体
Apache Burr 是 Apache 基金会下的 AI 智能体与应用开发框架,提供工具和抽象,帮助开发者构建、部署可信任的智能体应用,强调可靠性、可观测性和生产级部署。Hacker News 热门(buzzing.cc 中文翻译) ↗
18. OpenAI 与 Oracle 合作提供模型和 Codex 访问
OpenAI 与 Oracle 合作,用户可使用现有 Oracle 云服务承诺额度,在 Oracle 云上访问 OpenAI 模型和 Codex,以构建和部署 AI 应用并获得企业级安全与治理能力。OpenAI:官网动态(RSS · 排除企业/客户案例) ↗
19. OpenRouter 推出 Activity explorer
OpenRouter 发布 Activity explorer,可实时查看个人和团队在各模型上的花费,以及 token、缓存命中率、智能体和趋势等数据。X:OpenRouter (@OpenRouter) ↗
20. Text-To-Lottie 支持 Agent 生成并预览 Lottie 动画
开源项目 Text-To-Lottie 提供 Agent Skill 和本地预览工具,可让 Codex、Claude Code、Cursor 等 Agent 生成 Bodymovin JSON,并用 Skottie 在浏览器中实时验收。X:邵猛 (@shao__meng) ↗
21. 亚马逊分享大规模扁平化数据中心网络实践
亚马逊介绍在大规模数据中心中采用扁平化网络架构的工程设计,重点是通过简化拓扑和路由支撑超大规模集群的高带宽、低延迟通信。Hacker News 热门(buzzing.cc 中文翻译) ↗
22. 英特尔锐炫™ Pro B70 GPU 亮相 MPTS2026
英特尔展示面向 AI 创作的专业算力潜能。量子位 ↗
23. Azure API Management 推出 Unified Model API 与 MCP 内容安全
Azure API Management 支持统一格式对接 Anthropic、Vertex AI 等后端,并将内容安全扩展到 MCP 工具调用和 Agent-to-Agent 载荷。InfoQ AI ↗
24. Microsoft 开源 PostgreSQL 持久执行扩展 pg_durable
pg_durable 可在数据库内原生运行持久工作流,减少对外部编排系统的依赖。InfoQ AI ↗
公司与资本
25. Google 为 Anthropic 350 亿美元芯片租赁提供担保
Anthropic 正在五个数据中心租赁高性能计算芯片,Google 同意为各地点租赁付款提供兜底担保,帮助其获得相当于 350 亿美元的融资支持。Bloomberg:Technology(RSS) ↗
26. 百度智能云与 FluxA 共建 Agent 全球支付基础设施
双方达成战略合作,并邀请 30 家 OPC 参与内测。量子位 ↗
政策与安全
27. 工信部发布“AI+信息通信”创新发展意见
工信部要求加快400Gbps/800Gbps骨干网和城域低时延入算能力建设,推动5G-A/6G、光网络、IPv6+、工业互联网与AI融合,并鼓励电信企业发展智慧助理、家庭看护等应用。IT之家(RSS) ↗
28. Anthropic CEO 呼吁缩小 AI 政策差距
Dario Amodei 发文称 AI 发展速度已超出现有政策流程的应对能力,并提出缩小差距的行动方向。Anthropic 同步推出三项支持该框架的新举措。X:Anthropic (@AnthropicAI) ↗
29. Anthropic:AI 可在数小时内从补丁生成漏洞利用
Anthropic 安全团队发现,Mythos Preview AI 模型能在数小时内将 Firefox 和 Windows 内核安全补丁转化为可用漏洞利用,且成本低、门槛低。Anthropic 认为传统补丁节奏已过时。The Decoder:AI News(RSS) ↗
30. Google 因 AI 模型幻觉被判承担法律责任
一项法律裁决认定 Google 对其 AI 模型生成的幻觉内容负有法律责任。报道称,该判决若被其他国家效仿,可能产生广泛影响。Gary Marcus:The Road to AI We Can Trust(RSS) ↗
31. Google 将保存部分搜索媒体数据用于 AI 训练
Google 更新搜索交互数据保存方式,新增 Search Services History 设置,可保存 Lens 图片、Search Live 录音、语音搜索和 Translate 音频等数据,用于提供、改进和开发 AI 模型。用户可关闭相关设置以避免保存。The Verge:AI(RSS) ↗
32. 欧盟要求 Meta 免费开放 WhatsApp 给第三方 AI 助手
欧盟委员会发布临时措施,要求 Meta 在反垄断调查结束前,免费向第三方 AI 助手开放 WhatsApp 访问权限,认为其限制可能损害通用 AI 助手市场竞争。IT之家(RSS) ↗
33. 豆包AI 退票费误导引发起诉
河北用户咨询退票费时,豆包AI 给出错误估算,后又生成补偿承诺书但未兑现,并协助用户起草起诉状。用户已在北京互联网法院起诉豆包。X:X.PIN (@thexpin) ↗
论文与研究
34. Google Research 提出机器遗忘审计框架
Google Research 在 AISTATS 2026 发表正则化 f-散度核检验,用于高效审计 LLM 等模型是否真正遗忘特定训练数据,并降低大规模模型审计的计算成本。Google Research:Blog(网页) ↗
35. 百度百舸与复旦提出 LU-KV 框架
百度百舸团队与复旦大学提出 Long-horizon Utility KV(LU-KV)框架,将头级 KV Cache 预算分配建模为长程边际效用优化问题,在 LongBench 和 RULER 上降低显存占用和推理延迟,论文被 ICML 2026 录用。公众号:百度智能云(文心) ↗
观点与教程
36. Claude Design 使用经验分享
宝玉总结 Claude Design 的 5 点用法:引入设计系统、先搭少量功能再迭代、用 Markup 和 Edit 调整局部、管理上下文,以及用 Tweaks 调主题、布局和状态。X:宝玉 (@dotey) ↗
37. 演讲:大规模 AI 系统的上下文工程与记忆管理
Adi Polak 介绍如何用 Apache Kafka、Flink 与 MCP 构建有状态 AI Agent,缓解 token 限制、成本和延迟问题。InfoQ AI ↗
人物与动态
38. Bloomberg 深访 Anthropic 创始团队
Emily Chang 对话 Anthropic 联合创始人 Dario Amodei 和 Daniela Amodei,讨论公司起源、与五角大楼的摩擦,以及其在 AI 竞赛中强调安全的策略。Bloomberg:Technology(RSS) ↗
39. 微软总裁回应毕业典礼 AI 质疑
多场毕业典礼出现学生对 AI 的抵触。微软总裁 Brad Smith 称行业必须严肃回应公众担忧,并强调 AI 应增强人而非取代人。IT之家(RSS) ↗
今日脉络
-
模型推理继续追求更快与更轻 DiffusionGemma 以文本扩散并行生成提升速度,小米 1T 大模型也强调高吞吐表现,显示推理效率仍是模型竞争重点。
-
智能体开始进入金融与创作工作流 Magnetar 拟用大量 AI 智能体做股票研究,eToro 的 Tori 接入实时市场情绪能力;火山方舟则把版权、创作与变现串成平台机制。
-
开发者工具走向生产级与可观测 Cursor Bugbot 降低代码审查成本,Apache Burr 强调可靠智能体应用,OpenRouter Activity explorer 则补足模型使用成本与趋势监控。
-
政策、安全与责任问题升温 工信部推动“AI+信息通信”,Anthropic 提醒政策流程滞后;同时,模型幻觉责任、数据保存和补丁转漏洞利用等问题继续进入监管与安全视野。
总结
今天的线索表明,AI 产业的关键不只在模型更强,也在于能否以更低成本、更清晰责任和更稳定工具链进入真实业务。
评论 (0)
发表评论
请先登录后发表评论