引言
今日AI领域聚焦模型开源加速、产品迭代与资本动态,多项技术突破推动产业落地。
模型与能力
1. MiniMax 开源 M3 模型权重及 MSA 技术论文
MiniMax 开源 428B 总参、23B 激活的 M3 模型,发布 MSA 技术论文降低长上下文成本。M3 是首个多模态交错预训练开源模型,在多个排行榜获开源第一,输出速度提升至约 80 TPS。公众号:MiniMax(稀宇科技) ↗
2. 下一代投机解码:DFlash 与 Spec V2
Z Lab、Modal 与 SGLang 联合发布 DFlash 投机解码模型和 SGLang Spec V2 引擎,采用块扩散+KV 注入,在 Qwen 3.5 397B 上吞吐量达基线 4.3 倍。LMSYS:Blog(Chatbot Arena 团队) ↗
3. Noiz AI联合港科大清华开源音频生成大模型,单卡0.24秒4步出声
模型支持时间戳识别。量子位 ↗
4. 天工AI发布Matrix-Game 3.5,重新定义世界模型
昆仑万维公布最新技术突破。量子位 ↗
产品与应用
5. 6 倍速!Kimi K2.7 Code 高速版已上线
Kimi K2.7 Code 高速版上线,输出速度约 5-6 倍(常规 180 Token/s),API 定价为普通版 2 倍,模型 ID kimi-k2.7-code-highspeed。相比 K2.6 长上下文编程提升,token 消耗减少 30%。公众号:月之暗面(Kimi) ↗
6. OpenRouter 新增免费模型 gpt-oss-20b 和 Gemma4 26B
OpenRouter 新增免费容量,由 @eigenlabs 提供 gpt-oss-20b 和 Gemma 4 26B 模型。X:OpenRouter (@OpenRouter) ↗
7. Grok Build 推出 Agent Dashboard 管理多个编码会话
xAI 为 Grok Build 推出 Agent Dashboard,单屏管理编码会话,按状态分组,支持查看输出、回复、分派新会话,可通过 grok dashboard 等命令打开。xAI:News(网页) ↗
8. Meta 在 Facebook 上线“AI Mode”,基于平台公开信息合成答案
Meta 在 Facebook 推出 AI Mode 搜索,利用 Meta AI 从公开帖子合成答案;同步新增 AI 照片预设、视频拼贴等,并启动全球订阅计划。TechCrunch:AI(RSS) ↗
9. 宇树机器人计划登顶珠穆朗玛峰
宇树机器人计划登上珠穆朗玛峰,此前已成功登顶钦博拉索火山。量子位 ↗
10. 清华系创企成立一年即获车厂订单,具身智能落地真实产线
将具身智能应用于实际生产线。量子位 ↗
开发与基础设施
11. Claude Code v2.1.178 发布
Claude Code v2.1.178 新增 Tool(param:value) 语法、嵌套 skills 自动加载,改进子 agent 评估,修复 CLI 崩溃等问题。Claude Code:GitHub Releases(RSS) ↗
12. Flash-KMeans:IO 感知的精确 K-Means,GPU 上比 FAISS 快 200 倍以上
UC Berkeley 与 UT Austin 开源 Flash-KMeans,精确实现 Lloyd's k-Means,通过重构 GPU 数据流提速。在 H200 上比 FAISS 快 200 倍以上,支持 out-of-core 处理。MarkTechPost(RSS) ↗
13. xAI宣布Grok集成至Warp终端开发环境
xAI将Grok集成至终端开发环境Warp,近百万开发者可通过SuperGrok订阅访问Grok模型(包括grok-build-0.1),用于智能体开发。xAI:News(网页) ↗
14. Cloudflare引入Ensemble AI团队,加速AI基础设施研发
Cloudflare引入Ensemble AI团队,利用其NdLinear等模型压缩技术,整合至Workers AI平台,提升推理效率与GPU利用率。Cloudflare Blog ↗
15. OrcaRouter多模型组队低成本复刻Fable 5,性能反超
多模型协作优于单一最强模型。量子位 ↗
16. 华为云为Agent时代重建基础设施
推出Agentic新基建。量子位 ↗
17. AWS为ElastiCache for Valkey引入持久化存储选项
支持故障时数据保留,扩展缓存至持久化工作负载。InfoQ AI ↗
18. Anthropic详解Claude如何构建自身执行框架
披露Claude Code Dynamic Workflows中生成自定义执行框架协调AI代理团队的细节。InfoQ AI ↗
公司与资本
19. AI裁员浪潮持续升温
今年科技公司已累计裁员约15万,AI连续三个月被列为裁员首要原因。Block、Uber、Meta等裁员;同时Cerebras、SpaceX、Anthropic等估值高涨。民调显示生活成本成首要经济问题。TechCrunch:AI(RSS) ↗
20. Nvidia发行200亿美元债券,加入AI债务融资热潮
Nvidia计划通过自2021年来的首次债券发行筹集至少200亿美元,加入AI领域债务融资热潮。The Decoder:AI News(RSS) ↗
21. Salesforce 以 36 亿美元收购 AI 客服平台 Fin
Salesforce 宣布以 36 亿美元收购 AI 客服平台 Fin(前 Intercom),其技术将增强 Agentforce 平台,交易预计 2027 年初完成。TechCrunch:AI(RSS) ↗
22. 哈工程校友创企获全球海洋机器人最大单轮融资
上半年订单金额超10亿元。量子位 ↗
23. 校企共推AI4S:上海交通大学与太初元碁签署合作协议
上海交通大学与太初元碁签署合作协议,共同推进AI for Science研究与应用。量子位 ↗
政策与安全
24. Anthropic发布Claude Fable 5后因美国政府出口指令暂停
模型与Mythos 5共享架构,支持超大token,因强制数据保留要求影响部署。InfoQ AI ↗
论文与研究
25. GitHub 发布新开源数据集,加速多语言 AI 研究与开发
GitHub 在 CC0-1.0 许可下发布仓库级数据集,含多语言 README、issue、PR,推动多语言 AI 研究。GitHub Blog ↗
观点与教程
26. AI应用黄金时代到来:Fable被禁、Nadella观点与Salesforce收购Fin
美国政府关闭Anthropic的Fable,Nadella主张人类知识为护城河,Salesforce收购Fin。这些事件预示AI应用黄金时代,企业需掌握模型选择、智能体循环设计等技能。Tomer Tunguz 博客(VC 分析) ↗
27. GitHub Copilot CLI 初学者指南:常用斜杠命令概览
GitHub Copilot CLI初学者指南,介绍常用斜杠命令以控制终端中的AI智能体。GitHub Blog ↗
28. 云中AI治理:架构师实用指南
涵盖影子AI发现、数据分类、IAM策略执行、策略即代码及运营控制。InfoQ AI ↗
29. 从ICRA到CVPR,机器人圈最近在聊什么?北京·周三晚活动预告
活动预告:北京周三晚,探讨从ICRA到CVPR的机器人领域最新趋势与话题。量子位 ↗
30. 韩国人为何如此喜爱AI?
作者从旧金山飞往首尔,体验无人入境检查等场景,探讨韩国社会对AI的热情。MIT科技评论AI ↗
人物与动态
31. Skydio CEO Adam Bry:硅谷不应为无人机使用画红线
Skydio CEO Adam Bry认为无人机正转向AI驱动的自主基础设施,并主张硅谷不应限制无人机应用场景。The Verge:AI(RSS) ↗
今日脉络
-
开源模型与推理加速突破 MiniMax 开源 428B 总参 M3 模型并发布 MSA 论文降低长上下文成本;DFlash 投机解码在 Qwen 3.5 397B 上实现 4.3 倍吞吐量,推动推理效率跃升。
-
AI 产品与工具密集更新 Kimi K2.7 Code 高速版上线,输出速度提升 5-6 倍;Grok Build 推出 Agent Dashboard 管理编码会话;Meta 在 Facebook 上线 AI Mode 搜索。
-
资本与基础设施加速布局 Nvidia 发行 200 亿美元债券加入 AI 债务融资,Salesforce 以 36 亿美元收购 AI 客服平台 Fin;Flash-KMeans 在 GPU 上比 FAISS 快 200 倍以上。
总结
整体来看,开源模型生态持续扩展,推理效率提升显著,同时大厂并购与融资活跃,行业竞争加剧。
评论 (0)
发表评论
请先登录后发表评论