引言
今日AI领域亮点纷呈:模型能力持续升级,Agent应用加速落地,基础设施与开发工具迎来重大更新。以下为关键动态速览。
模型与能力
1. ChatGPT 上线双向 AI 语音模型 Bidi 1,支持边说话边打断
部分用户反馈 ChatGPT 网页版和 App 版新增 Bidi 1 语音模型,支持双向监听和打断指令,预计本周扩大测试。IT之家(RSS) ↗
2. GPT-5.5 Instant 新版上线,对话更智能有趣
新版 GPT-5.5 Instant 能更好理解意图并调整回应,处理复杂约束更可靠,今天向付费用户推送,明天免费。X:OpenAI (@OpenAI) ↗
3. Gemini 3.5 Flash 内置计算机使用工具,支持跨环境智能体
Google 将 Computer use 作为内置工具集成至 Gemini 3.5 Flash,开发者可通过 Gemini API 调用,新增安全保护,适合长周期企业自动化。Hacker News 热门(buzzing.cc 中文翻译) ↗
4. MiniCPM-V 4.6 在 Apple Core AI 上高速运行
在 Apple Core AI 上以不到2B参数高速运行,推动高效多模态AI。X:面壁智能 OpenBMB (@OpenBMB) ↗
5. 通义千问开源 Qwen-AgentWorld,引入原生语言世界模型
Qwen-AgentWorld 覆盖七大领域,基于超千万真实轨迹训练,在 AgentWorldBench 超越 GPT-5.4 和 Claude Opus 4.8,两种范式验证能力。公众号:通义实验室(千问) ↗
产品与应用
6. Figma Config 2026 扩展画布,AI 功能依赖 Anthropic、OpenAI 等外部模型
Figma 扩展代码、动画、3D 深度等,集成 Weave 工作流;AI 功能依赖外部模型,推理成本挤压利润率,面临竞争威胁。The Decoder:AI News(RSS) ↗
7. 豆包推出专业版,基于豆包 2.1 系列大模型,面向复杂办公
豆包专业版支持操作本地电脑、浏览器、调用 Skills、定时任务,内置 Office 套件,免费用户可用 Turbo 版,专业版定价 68-500 元/月。公众号:豆包(字节) ↗
8. Notion 集成 Cursor SDK,文档中嵌入编码智能体
Notion 通过 Cursor SDK 在文档、讨论串、数据库中使用 Cursor 智能体,端到端完成规划、构建、测试、PR,支持自定义模板和 MCP。Cursor Blog ↗
9. Perplexity 推出 Computer for Counsel,连接律师常用工具
Perplexity 推出面向律师的 Computer for Counsel,连接研究数据库、文档工具和案件管理系统,Pro 和 Max 用户可用。X:Perplexity (@perplexity_ai) ↗
10. AI填志愿成高考后新现象,超1400万用户使用千问
几分钟即可生成一份志愿报告。量子位 ↗
11. Claude Code 大升级,卡帕西称 LLM 第三次变革
A 社约 65% 的产品代码已由 Claude Tag 参与完成。量子位 ↗
12. 物理AI在公路货运跑通闭环,申通安用下单
申通安用已实际采购。量子位 ↗
13. 豆包专业版上线,开始收费
首开付费模式。量子位 ↗
开发与基础设施
14. FFASR 排行榜发布:远场 ASR 评测基准
Treble Technologies 与 Hugging Face 联合推出 FFASR(Far-Field ASR)排行榜,首个开源社区驱动的真实远场声学条件 ASR 评测基准。使用混合波模拟引擎生成数据,涵盖 14 种房间和三个信噪比级别,报告词错误率(WER)和实时因子(RTFx)。Hugging Face:Blog(RSS) ↗
15. NVIDIA NeMo AutoModel:一行代码加速 Transformer MoE 模型微调
NVIDIA NeMo AutoModel 是基于 Transformers v5 的开源库,添加 Expert Parallelism、DeepEP 和 TransformerEngine 内核。MoE 微调中训练吞吐量提升 3.4–3.7 倍,GPU 内存减少 29–32%,仅需改动一行 import。支持 550B 模型全微调。Hugging Face:Blog(RSS) ↗
16. OpenRouter 零数据留存(ZDR)实践:新增 97 款模型,流量占比近半
OpenRouter 的零数据留存(ZDR)保证用户提示词和响应不被存储;自 1 月以来新增 97 款 ZDR 模型,月度 token 量增长 4.3 倍,约占路由流量一半。支持账户级、护栏级和单次请求级控制。OpenRouter:Announcements(RSS) ↗
17. Mistral AI 为 Connectors 推出安全与可控新能力
Mistral AI 发布 Connectors 多项新能力,包括管理控制、API 密钥作用域、多账户连接器、调试器、Vibe Code 和工作流集成。Mistral AI:News(网页) ↗
18. OpenAI 与 Broadcom 发布 LLM 推理定制芯片 Jalapeño
OpenAI 与 Broadcom 联合推出专门为大语言模型(LLM)推理优化的定制 AI 芯片 Jalapeño,旨在提升性能、效率与规模。OpenAI:官网动态(RSS · 排除企业/客户案例) ↗
19. 火山引擎发布 Agent Ready 基础设施,AgentKit 与 ArkClaw 企业版升级
火山引擎推出面向企业智能应用的 Agent Ready 架构,AgentKit 提供身份、运行时、沙箱等模块,ArkClaw 企业版集成 Agent 广场、技能中心等,实践案例显示效率提升。公众号:火山引擎 ↗
20. 百度智能云发布百度千帆Token Plan企业版,提供GLM-5.2等模型
已率先完成智谱GLM-5.2适配。量子位 ↗
21. 阿里QoderWork推出峰谷Token,夜间Qwen3.7低至2折
涵盖QoderWork、Qoder Desktop等。量子位 ↗
22. AI 进入软件生命周期上游:从代码审查到 PRD 治理
Uber、DoorDash 与 Cloudflare 将 AI 扩展到 PRD 验证、设计输入等环节,实现 AI 驱动治理。InfoQ AI ↗
23. Google 推出 OpenRL:用于 LLM 后训练微调的自托管 API
Google GKE Labs 开源 OpenRL,提供在 Kubernetes 上自托管 API 进行 LLM 后训练与微调。InfoQ AI ↗
24. 面向 AI 的网络数据基础设施层兴起
AI 应用需要大规模数据,但网络数据的封锁与非结构化限制了模型使用。MIT科技评论AI ↗
公司与资本
25. Momenta 率先冲刺 IPO
AI司机收入3年涨42倍。量子位 ↗
26. 1小时真机RL微调成功率破95%!HIL-ResRL:即插即用的VLA“外挂”神器
该条目暂无摘要。量子位 ↗
政策与安全
27. NSA 因与 Anthropic 纠纷失去对 Mythos 的访问权限
美国国家安全局(NSA)因与人工智能公司 Anthropic 的纠纷,失去了对 Mythos 系统的访问权限。Hacker News 热门(buzzing.cc 中文翻译) ↗
论文与研究
28. DFlash:块扩散草稿模型实现最高 15 倍吞吐量提升
UC San Diego 团队提出 DFlash,一种用于投机解码的轻量块扩散草稿模型。一次前向生成整块 token 并由目标模型并行验证,无损输出。相比 EAGLE-3 最高加速 2.5 倍,在 Qwen3-8B 等模型上平均无损加速超 6 倍;在 NVIDIA Blackwell 上 gpt-oss-120b 吞吐量提升最高 15 倍。MarkTechPost(RSS) ↗
29. 思考即回忆:推理如何解锁 LLM 中的参数化知识
Google Research 研究发现推理(chain-of-thought)能帮助 LLM 回忆简单事实。在 Gemini-2.5 Flash/Pro 和 Qwen3-32B 上,启用推理后模型可回答原本无法直接回答的问题。机制包括推理 token 作为计算缓冲以及事实启动效应。Google Research:Blog(网页) ↗
30. 港大MaRS Lab获IEEE TRO最佳论文奖,华为天才少年为一作
开源项目GitHub获4.2k Star。量子位 ↗
观点与教程
31. 字节跳动技术副总裁洪定坤:AI Coding 的实践与探索
在火山引擎 Force 大会,字节跳动技术副总裁洪定坤分享 AI Coding 实践。过去一年字节 AI 代码贡献率增长 6 倍,但主流 Coding 模型可交付性仅 40-60 分。结合 Harness 基建提升至 80 分,并推出 TRAE Work。公众号:火山引擎 ↗
32. 工程岗位是 2025 年最具韧性的岗位:AI 尚未显著冲击
风投 SignalFire 数据显示,工程是 2025 年最具韧性的岗位;大型科技公司工程岗招聘降幅(11%)远低于总招聘(25%)。Anthropic CEO 警告 AI 可能消灭白领岗位,但其经济主管称尚未看到显著影响。黄仁勋称 AI 让工程师更忙碌。TechCrunch:AI(RSS) ↗
33. 里德·霍夫曼:SpaceX 不是 AI 公司,xAI 是“彻底的灾难”
LinkedIn 联合创始人、Anthropic/OpenAI 投资者 Reid Hoffman 在播客中批评 SpaceX 不是 AI 公司,xAI 所有联合创始人已离职且 Grok 落后;还批评美国政府强制 Anthropic 下架模型。Hacker News 热门(buzzing.cc 中文翻译) ↗
34. 5 条规则理解语言模型行为:从分词盲点到迎合机制
Naomi Saphra 解析 LLM 的群体行为、分词盲点以及模型如何通过数据关联迎合用户偏见。InfoQ AI ↗
人物与动态
35. 175个早期项目将在WAIC2026展示,谁将成为下一个AI巨头?
报名通道已开启。量子位 ↗
今日脉络
-
模型能力密集更新:实时交互与推理效率提升 ChatGPT上线双向AI语音模型Bidi 1,支持边说话边打断;GPT-5.5 Instant新版更智能有趣;Gemini 3.5 Flash内置计算机使用工具,支持跨环境智能体;MiniCPM-V 4.6在Apple Core AI上高速运行。
-
产品应用深化:办公助手与专业工具集中落地 豆包推出专业版,面向复杂办公并开始收费;Notion集成Cursor SDK,文档中嵌入编码智能体;Perplexity推出面向律师的Computer for Counsel;Figma Config 2026依赖外部AI模型扩展画布。
-
开发基础设施升级:微调效率与数据安全并重 NVIDIA NeMo AutoModel一行代码加速MoE微调,吞吐量提升超3倍;OpenRouter零数据留存实践新增97款模型;火山引擎发布Agent Ready基础设施;Mistral AI为Connectors推出安全可控新能力。
总结
今日动态显示AI竞争聚焦于实时交互能力、Agent化应用及开发效率提升。模型与工具快速迭代,企业级部署与安全可控成为新焦点。
评论 (0)
发表评论
请先登录后发表评论