AI日报 · 2026-06-25 - ephron's blog

引言

今日AI领域亮点纷呈：模型能力持续升级，Agent应用加速落地，基础设施与开发工具迎来重大更新。以下为关键动态速览。

模型与能力

1. ChatGPT 上线双向 AI 语音模型 Bidi 1，支持边说话边打断

部分用户反馈 ChatGPT 网页版和 App 版新增 Bidi 1 语音模型，支持双向监听和打断指令，预计本周扩大测试。IT之家（RSS） ↗

2. GPT-5.5 Instant 新版上线，对话更智能有趣

新版 GPT-5.5 Instant 能更好理解意图并调整回应，处理复杂约束更可靠，今天向付费用户推送，明天免费。X：OpenAI (@OpenAI) ↗

3. Gemini 3.5 Flash 内置计算机使用工具，支持跨环境智能体

Google 将 Computer use 作为内置工具集成至 Gemini 3.5 Flash，开发者可通过 Gemini API 调用，新增安全保护，适合长周期企业自动化。Hacker News 热门（buzzing.cc 中文翻译） ↗

4. MiniCPM-V 4.6 在 Apple Core AI 上高速运行

在 Apple Core AI 上以不到2B参数高速运行，推动高效多模态AI。X：面壁智能 OpenBMB (@OpenBMB) ↗

5. 通义千问开源 Qwen-AgentWorld，引入原生语言世界模型

Qwen-AgentWorld 覆盖七大领域，基于超千万真实轨迹训练，在 AgentWorldBench 超越 GPT-5.4 和 Claude Opus 4.8，两种范式验证能力。公众号：通义实验室（千问） ↗

产品与应用

6. Figma Config 2026 扩展画布，AI 功能依赖 Anthropic、OpenAI 等外部模型

Figma 扩展代码、动画、3D 深度等，集成 Weave 工作流；AI 功能依赖外部模型，推理成本挤压利润率，面临竞争威胁。The Decoder：AI News（RSS） ↗

7. 豆包推出专业版，基于豆包 2.1 系列大模型，面向复杂办公

豆包专业版支持操作本地电脑、浏览器、调用 Skills、定时任务，内置 Office 套件，免费用户可用 Turbo 版，专业版定价 68-500 元/月。公众号：豆包（字节） ↗

8. Notion 集成 Cursor SDK，文档中嵌入编码智能体

Notion 通过 Cursor SDK 在文档、讨论串、数据库中使用 Cursor 智能体，端到端完成规划、构建、测试、PR，支持自定义模板和 MCP。Cursor Blog ↗

9. Perplexity 推出 Computer for Counsel，连接律师常用工具

Perplexity 推出面向律师的 Computer for Counsel，连接研究数据库、文档工具和案件管理系统，Pro 和 Max 用户可用。X：Perplexity (@perplexity_ai) ↗

10. AI填志愿成高考后新现象，超1400万用户使用千问

几分钟即可生成一份志愿报告。量子位 ↗

11. Claude Code 大升级，卡帕西称 LLM 第三次变革

A 社约 65% 的产品代码已由 Claude Tag 参与完成。量子位 ↗

12. 物理AI在公路货运跑通闭环，申通安用下单

申通安用已实际采购。量子位 ↗

13. 豆包专业版上线，开始收费

首开付费模式。量子位 ↗

开发与基础设施

14. FFASR 排行榜发布：远场 ASR 评测基准

Treble Technologies 与 Hugging Face 联合推出 FFASR（Far-Field ASR）排行榜，首个开源社区驱动的真实远场声学条件 ASR 评测基准。使用混合波模拟引擎生成数据，涵盖 14 种房间和三个信噪比级别，报告词错误率（WER）和实时因子（RTFx）。Hugging Face：Blog（RSS） ↗

15. NVIDIA NeMo AutoModel：一行代码加速 Transformer MoE 模型微调

NVIDIA NeMo AutoModel 是基于 Transformers v5 的开源库，添加 Expert Parallelism、DeepEP 和 TransformerEngine 内核。MoE 微调中训练吞吐量提升 3.4–3.7 倍，GPU 内存减少 29–32%，仅需改动一行 import。支持 550B 模型全微调。Hugging Face：Blog（RSS） ↗

16. OpenRouter 零数据留存（ZDR）实践：新增 97 款模型，流量占比近半

OpenRouter 的零数据留存（ZDR）保证用户提示词和响应不被存储；自 1 月以来新增 97 款 ZDR 模型，月度 token 量增长 4.3 倍，约占路由流量一半。支持账户级、护栏级和单次请求级控制。OpenRouter：Announcements（RSS） ↗

17. Mistral AI 为 Connectors 推出安全与可控新能力

Mistral AI 发布 Connectors 多项新能力，包括管理控制、API 密钥作用域、多账户连接器、调试器、Vibe Code 和工作流集成。Mistral AI：News（网页） ↗

18. OpenAI 与 Broadcom 发布 LLM 推理定制芯片 Jalapeño

OpenAI 与 Broadcom 联合推出专门为大语言模型（LLM）推理优化的定制 AI 芯片 Jalapeño，旨在提升性能、效率与规模。OpenAI：官网动态（RSS · 排除企业/客户案例） ↗

19. 火山引擎发布 Agent Ready 基础设施，AgentKit 与 ArkClaw 企业版升级

火山引擎推出面向企业智能应用的 Agent Ready 架构，AgentKit 提供身份、运行时、沙箱等模块，ArkClaw 企业版集成 Agent 广场、技能中心等，实践案例显示效率提升。公众号：火山引擎 ↗

20. 百度智能云发布百度千帆Token Plan企业版，提供GLM-5.2等模型

已率先完成智谱GLM-5.2适配。量子位 ↗

21. 阿里QoderWork推出峰谷Token，夜间Qwen3.7低至2折

涵盖QoderWork、Qoder Desktop等。量子位 ↗

22. AI 进入软件生命周期上游：从代码审查到 PRD 治理

Uber、DoorDash 与 Cloudflare 将 AI 扩展到 PRD 验证、设计输入等环节，实现 AI 驱动治理。InfoQ AI ↗

23. Google 推出 OpenRL：用于 LLM 后训练微调的自托管 API

Google GKE Labs 开源 OpenRL，提供在 Kubernetes 上自托管 API 进行 LLM 后训练与微调。InfoQ AI ↗

24. 面向 AI 的网络数据基础设施层兴起

AI 应用需要大规模数据，但网络数据的封锁与非结构化限制了模型使用。MIT科技评论AI ↗

公司与资本

25. Momenta 率先冲刺 IPO

AI司机收入3年涨42倍。量子位 ↗

26. 1小时真机RL微调成功率破95%！HIL-ResRL：即插即用的VLA“外挂”神器

该条目暂无摘要。量子位 ↗

政策与安全

27. NSA 因与 Anthropic 纠纷失去对 Mythos 的访问权限

美国国家安全局（NSA）因与人工智能公司 Anthropic 的纠纷，失去了对 Mythos 系统的访问权限。Hacker News 热门（buzzing.cc 中文翻译） ↗

论文与研究

28. DFlash：块扩散草稿模型实现最高 15 倍吞吐量提升

UC San Diego 团队提出 DFlash，一种用于投机解码的轻量块扩散草稿模型。一次前向生成整块 token 并由目标模型并行验证，无损输出。相比 EAGLE-3 最高加速 2.5 倍，在 Qwen3-8B 等模型上平均无损加速超 6 倍；在 NVIDIA Blackwell 上 gpt-oss-120b 吞吐量提升最高 15 倍。MarkTechPost（RSS） ↗

29. 思考即回忆：推理如何解锁 LLM 中的参数化知识

Google Research 研究发现推理（chain-of-thought）能帮助 LLM 回忆简单事实。在 Gemini-2.5 Flash/Pro 和 Qwen3-32B 上，启用推理后模型可回答原本无法直接回答的问题。机制包括推理 token 作为计算缓冲以及事实启动效应。Google Research：Blog（网页） ↗

30. 港大MaRS Lab获IEEE TRO最佳论文奖，华为天才少年为一作

开源项目GitHub获4.2k Star。量子位 ↗

观点与教程

31. 字节跳动技术副总裁洪定坤：AI Coding 的实践与探索

在火山引擎 Force 大会，字节跳动技术副总裁洪定坤分享 AI Coding 实践。过去一年字节 AI 代码贡献率增长 6 倍，但主流 Coding 模型可交付性仅 40-60 分。结合 Harness 基建提升至 80 分，并推出 TRAE Work。公众号：火山引擎 ↗

32. 工程岗位是 2025 年最具韧性的岗位：AI 尚未显著冲击

风投 SignalFire 数据显示，工程是 2025 年最具韧性的岗位；大型科技公司工程岗招聘降幅（11%）远低于总招聘（25%）。Anthropic CEO 警告 AI 可能消灭白领岗位，但其经济主管称尚未看到显著影响。黄仁勋称 AI 让工程师更忙碌。TechCrunch：AI（RSS） ↗

33. 里德·霍夫曼：SpaceX 不是 AI 公司，xAI 是“彻底的灾难”

LinkedIn 联合创始人、Anthropic/OpenAI 投资者 Reid Hoffman 在播客中批评 SpaceX 不是 AI 公司，xAI 所有联合创始人已离职且 Grok 落后；还批评美国政府强制 Anthropic 下架模型。Hacker News 热门（buzzing.cc 中文翻译） ↗

34. 5 条规则理解语言模型行为：从分词盲点到迎合机制

Naomi Saphra 解析 LLM 的群体行为、分词盲点以及模型如何通过数据关联迎合用户偏见。InfoQ AI ↗

人物与动态

35. 175个早期项目将在WAIC2026展示，谁将成为下一个AI巨头？

报名通道已开启。量子位 ↗

今日脉络

模型能力密集更新：实时交互与推理效率提升 ChatGPT上线双向AI语音模型Bidi 1，支持边说话边打断；GPT-5.5 Instant新版更智能有趣；Gemini 3.5 Flash内置计算机使用工具，支持跨环境智能体；MiniCPM-V 4.6在Apple Core AI上高速运行。
产品应用深化：办公助手与专业工具集中落地 豆包推出专业版，面向复杂办公并开始收费；Notion集成Cursor SDK，文档中嵌入编码智能体；Perplexity推出面向律师的Computer for Counsel；Figma Config 2026依赖外部AI模型扩展画布。
开发基础设施升级：微调效率与数据安全并重 NVIDIA NeMo AutoModel一行代码加速MoE微调，吞吐量提升超3倍；OpenRouter零数据留存实践新增97款模型；火山引擎发布Agent Ready基础设施；Mistral AI为Connectors推出安全可控新能力。

总结

今日动态显示AI竞争聚焦于实时交互能力、Agent化应用及开发效率提升。模型与工具快速迭代，企业级部署与安全可控成为新焦点。

AI日报 · 2026-06-25

引言