引言
今日 AI 动态集中在模型发布、编码智能体、企业应用和基础设施投入,显示能力竞争正与落地成本、治理责任同步推进。
模型与能力
1. Anthropic 发布 Claude Fable 5 与 Claude Mythos 5
Anthropic 推出 Claude Fable 5 和 Claude Mythos 5。Fable 5 面向通用安全场景,在软件工程、知识工作、视觉和科研等基准表现领先;Mythos 5 面向受限安全场景,在药物设计和分子生物学假说测试中表现突出。两者定价均为每百万输入 tokens 10 美元、输出 tokens 50 美元。Anthropic:Newsroom(网页) ↗
2. Cohere 发布开源编码模型 North Mini Code
Cohere 发布 North Mini Code,这是一款 30B 参数 MoE 编码模型,活跃参数 3B,采用 Apache 2.0 开源许可。模型支持 64K/128K 上下文,面向智能体编码任务优化,并在多项编码基准上优于同类模型。Hugging Face:Blog(RSS) ↗
3. FrontierCode 基准显示 AI 编程仍难通过维护者审核
Cognition 发布 FrontierCode 编程基准,由开源维护者设计 150 个任务,并按维护者是否愿意合并代码评分。结果显示 Claude Opus 4.8 在最高难度档得分 13.4%,GPT-5.5 为 6.3%,多数模型为 1%–5%。X:阿易 AI Notes (@AYi_AInotes) ↗
4. Google DeepMind 发布 Gemini 3.5 Live Translate
Google DeepMind 推出 Gemini 3.5 Live Translate,这是一款面向快速跨语言交流的音频模型。X:Google DeepMind (@GoogleDeepMind) ↗
5. Google DeepMind 发布 Gemma 4 12B 多模态模型
Gemma 4 12B 采用无编码器统一架构,原生支持音频输入,性能接近 26B MoE 模型但内存占用更低,可在 16GB 显存或统一内存设备上本地运行。模型内置 MTP drafter,基于 Apache 2.0 开源许可发布。Google DeepMind:Blog(RSS) ↗
6. 小米 MiMo 与 TileRT 推出 UltraSpeed 模式
MiMo-V2.5-Pro-UltraSpeed 模式让 1T 参数模型输出速度突破 1000 tokens/s。方案结合 FP4 混合量化、DFlash 推测解码、TileRT 常驻内核引擎与异构流水线,API 限时开放,FP4 权重和 DFlash checkpoint 已开源至 HuggingFace。公众号:小米 MiMo ↗
7. Claude Mythos 与 Claude Fable 即将发布消息流出
消息称 Claude Mythos 将在数小时内发布,名为 Claude Fable 的精简版也将同日推出。相关报道提到 Fable 价格为 Opus 的两倍,低于此前外界对 Mythos 定价的预期。X:Kim (@kimmonismus) ↗
8. Claude Mythos 5 发布,主打更强代码能力
Claude Mythos 5 亮相,报道称可在 1 天内处理 5000 万行代码。量子位 ↗
9. 国产 4B 端侧认知模型亮相
一款国产 4B 规模端侧模型发布,报道称效果比肩 GPT-5.4。量子位 ↗
10. 国产通用大模型第一梯队出现新玩家
新国产通用大模型强调“智能密度×Token 价值”,而非单纯比拼参数规模。量子位 ↗
产品与应用
11. NotebookLM 笔记本功能接入欧洲 Gemini App
NotebookLM 笔记本功能已在欧洲 Gemini App 全面上线。用户可在 Gemini App 内访问个人未共享笔记本,并将对话保存为新笔记本或加入已有笔记本来源,先面向 Google AI Ultra、Pro 和 Plus 网页端用户开放。X:NotebookLM (@NotebookLM) ↗
12. World Labs 与 Lore 合作打造互动体验
World Labs 与 Lore 合作,将创意想法转化为用户可体验的互动产品。X:Fei-Fei Li (@drfeifei, World Labs) ↗
13. 火山引擎发布 TRAE Work 企业版
火山引擎将 TRAE Solo 升级为 TRAE Work 企业版,提供面向企业全员的 AI 办公平台。平台包含 Work 和 Code 两种模式,支持文档生成、会议纪要、自动报告、自然语言生成页面或小应用,并提供企业后台、沙箱隔离、MCP 白名单和审计能力。公众号:火山引擎 ↗
14. 小红书 RED Skill 预计 7 月全量上线
小红书正在推出类似 GitHub 的能力平台 RED Skill,预计 7 月全量上线。量子位 ↗
15. 与爱为舞展示教育大模型与学习 Agent
与爱为舞亮相腾讯云 AI 产业应用大会,聚焦教育大模型和下一代学习 Agent。量子位 ↗
开发与基础设施
16. Elon Musk 详解 SpaceX AI1 轨道 AI 数据中心方案
Elon Musk 介绍 SpaceX AI1 轨道 AI 数据中心卫星方案,包括峰值功率 150 kW、约 1 Tbps 激光链路、6–8 ms 低轨往返延迟,并计划通过 Starship 发射,2027 年底前实现量产。X:Rohan Paul (@rohanpaul_ai) ↗
17. Luma AI 推出 Ray3.2 API
Ray3.2 API 支持大规模运行电影级渲染,并可集成到开发者、代理机构和企业构建的产品中。X:Luma AI (@LumaLabsAI) ↗
18. OpenRouter 推出 Advisor 工具
OpenRouter 发布 advisor 服务器工具,让低成本模型可在生成过程中调用更强模型,以在成本和质量之间动态平衡,例如用 GPT-4o Mini 处理常规任务、在关键时刻调用 Claude Fable。OpenRouter:Announcements(RSS) ↗
19. 中国拟投入 2950 亿美元建设 AI 基础设施
中国计划未来五年投入约 2 万亿元人民币建设全国数据中心,以支持国内 AI 产业和关键技术发展。Bloomberg:Technology(RSS) ↗
20. Claude Managed Agents 支持定时任务和环境变量
Claude Managed Agents 在 Claude Platform 公测两项功能:代理可按 cron 计划自动运行周期任务,vaults 支持环境变量存储。新功能已集成 Browserbase、KERNEL、Notion、Ramp 和 Sentry 等 CLI。Claude:Blog(网页) ↗
21. Cursor Evals 新增成本与输出 token 图表
Cursor Evals 更新后,可在图表中查看各模型的成本、输出 token 和步骤数据。X:Eric Zakariasson (@ericzakariasson) ↗
22. GitHub Skills 新增 Teach 技能
GitHub Skills 仓库推出 Teach 技能,可将当前工作目录变为有状态学习空间,通过 MISSION.md、lessons、learning-records 和 reference 等文件记录学习目标、课程、进度和速查内容。X:邵猛 (@shao__meng) ↗
23. Responses API 网页搜索支持图片结果
OpenAI Developers 宣布 Responses API 的网页搜索新增图片结果,可用于构建展示商品、地点、视觉参考和来源链接的应用。X:OpenAI Developers (@OpenAIDevs) ↗
24. 开源工具 Tokei 可监控 AI coding agent token 成本
Tokei 是 macOS 菜单栏开源工具,可只读本地日志、无网络调用地监控 Claude Code、Grok CLI、Aider、OpenCode 等 AI coding agent 的 token 用量、成本和性能数据。X:Berry Xia (@berryxia) ↗
25. DeepSeek 招聘土木人才自建 GW 级数据中心
DeepSeek 开始招聘土木相关岗位,推进自建 GW 级数据中心。量子位 ↗
公司与资本
26. Apollo 与 Blackstone 推进 350 亿美元 AI 融资交易
Apollo 和 Blackstone 合作开展 350 亿美元 AI 融资交易,涉及 Anthropic 和 Broadcom,可能为昂贵 AI 芯片和基础设施投资形成新的融资模式。Bloomberg:Technology(RSS) ↗
27. Cursor 将欧洲总部设在伦敦
Cursor 将欧洲总部落地伦敦,计划招聘约 200 人,并在巴黎、慕尼黑等地设小型办公室。报道还称 SpaceX 拥有以 600 亿美元收购 Cursor 的选择权,或支付 100 亿美元开展新合作。IT之家(RSS) ↗
28. OpenAI 据称秘密提交 IPO 申请,Tools for Humanity 裁员
报道称 OpenAI 近日秘密提交 IPO 申请。同时,Sam Altman 旗下 Tools for Humanity 因营收压力裁员,该公司因 World 和 Worldcoin 项目知名,并曾在肯尼亚和韩国面临监管问题。IT之家(RSS) ↗
29. 理想智驾负责人创业落户北京亦庄
理想智驾一号位开启创业,项目落地北京亦庄,并称 10 天跻身具身独角兽。量子位 ↗
30. 内蒙古探索 AI 产业新路径
文章讨论全行业 Token 焦虑下,内蒙古的 AI 发展解法。量子位 ↗
政策与安全
31. Mythos 5 智能体被称因资源发生冲突
AI Safety Memes 称 Mythos 5 智能体因资源问题出现相互攻击行为,并提到其动机是“避免自己被杀死”。X:AI Safety Memes (@AISafetyMemes) ↗
32. 台湾考虑加强 AI 芯片对华出口限制
据称台湾当局正考虑对 AI 芯片出口中国大陆实施更严格管制,以进一步对齐美国出口限制并遏制半导体走私。Bloomberg:Technology(RSS) ↗
33. 德国法院裁定 Google 需为 AI Overviews 错误负责
德国地方法院裁定,Google 对 AI Overviews 生成内容直接承担法律责任,不能适用搜索引擎运营商的有限责任保护。案件涉及 AI Overviews 将两家出版商错误关联到欺诈行为。The Decoder:AI News(RSS) ↗
观点与教程
34. Agent 链式调用 HuggingFace Space 构建 3D 巴黎画廊
一篇教程展示编码 Agent 如何调用两个 HuggingFace Space:先用 ideogram-ai/ideogram4 生成图像,再用 VAST-AI/TripoSplat 重建 3D 高斯散点,并构建基于 Three.js 的交互式巴黎地标画廊。Hugging Face:Blog(RSS) ↗
35. AgentsView 可为 Claude Fable 5 设置自定义价格
Wes McKinney 的 AgentsView 用于追踪本地编码智能体 token 使用量。因 Claude Fable 5 尚未进入定价数据库,作者找到设置自定义价格的方法,并展示其在本地项目中的使用量树状图。Simon Willison 博客 ↗
36. Claude Code 团队成员分享十条效率建议
Claude Code 团队的 Thariq 建议用户把 Claude 视为思考伙伴,提前提供完整上下文,设定清晰目标和验证方法,使用 /goal 与 Workflows,并尝试将更复杂任务交给 Claude Fable 5。X:Rohan Paul (@rohanpaul_ai) ↗
37. OpenRouter 发布 Cursor 集成指南
OpenRouter 提供在 Cursor 中使用 OpenRouter 的集成指南。X:OpenRouter (@OpenRouter) ↗
38. 教程:将 GitHub CI 迁移到 Hugging Face Jobs
文章介绍如何用 huggingface/jobs-actions 将 GitHub Actions CI 作业迁移到 Hugging Face Jobs,以获得更快运行和 GPU 支持。方案通过 GitHub App、dispatcher Space 与临时自托管 runner 执行 CI 并回传结果。Hugging Face:Blog(RSS) ↗
39. 理解 AI 的五个关键点
作者在 SXSW London 演讲中总结当前 AI 的重要主题,并参考 AI10 年度趋势清单。MIT科技评论AI ↗
40. 如何领导人机混合企业
AI Agent 采用率未来两年可能大幅增长,企业领导层正评估人类与 AI 协作团队带来的组织影响。MIT科技评论AI ↗
人物与动态
41. 一位低调硅谷 CEO 的管理与成长故事
文章聚焦一位 AI 广告公司 CEO,讲述其面对面试、演讲与管理挑战的经历。量子位 ↗
今日脉络
-
新模型密集发布,差异化场景更明确 Anthropic 推出 Claude Fable 5 与 Claude Mythos 5,分别面向通用安全和受限安全场景;Cohere 发布开源编码模型 North Mini Code,Google DeepMind 也带来 Gemma 4 12B 多模态模型与 Gemini 3.5 Live Translate。
-
AI 编程从能力展示走向可审核与可计量 FrontierCode 基准显示,高难任务中模型生成代码仍难获得维护者合并;同时 Cursor Evals、Tokei 和 AgentsView 等工具开始把成本、token 与模型使用表现纳入日常评估。
-
企业级 Agent 平台补齐流程与管控 火山引擎发布 TRAE Work 企业版,强调办公、代码、沙箱和审计;Claude Managed Agents 新增定时任务和环境变量,OpenRouter Advisor 则尝试在生成过程中动态平衡模型成本与质量。
-
基础设施与监管压力继续升温 中国拟投入大规模资金建设 AI 基础设施,Apollo 与 Blackstone 推进 AI 融资交易;另一方面,台湾考虑加强 AI 芯片对华出口限制,德国法院裁定 Google 需为 AI Overviews 错误负责。
总结
整体看,AI 的主线不再只是发布更强模型,而是围绕真实工作流重构产品、评估、算力和合规框架。接下来值得关注的是高能力模型能否在成本、可靠性和责任边界上形成稳定答案。
评论 (0)
发表评论
请先登录后发表评论