AI日报 · 2026-05-29 - ephron's blog

今日观察

智能体能力成为模型竞争焦点，编码与任务执行优化密集涌现^[1]^[2]^[9]^[16]^[29]。

模型向端侧与轻量化部署加速，设备端推理与专用芯片布局活跃^[5]^[23]^[31]。

头部AI公司融资规模持续扩大，明星初创企业推进上市计划^[19]^[20]^[21]。

AI工具深度集成主流生产力软件，企业级应用平台与安全治理框架同步发展^[11]^[13]^[26]^[28]^[38]。

模型发布/更新

1. Anthropic发布Claude Opus 4.8模型，编码与智能体能力显著提升

Anthropic推出Claude Opus 4.8，在编码、智能体任务、推理等基准测试中全面进步。该模型已上线各大平台，API定价不变，Fast模式降价约三分之二并提速。同步推出Claude Code动态工作流功能，支持并行调度数百子智能…Anthropic ↗

2. xAI发布Grok Build 0.1，专为智能体编码优化

xAI通过API公开测试其新编码模型Grok Build 0.1。该模型专为智能体编码任务训练，支持网页开发、调试和MCP，驱动Grok Build CLI。推理速度超过100 tokens/秒。x.ai ↗

3. Google正式发布Nano Banana系列图像生成模型

Google宣布Nano Banana Pro (gemini-3-pro-image) 和 Nano Banana 2 (gemini-3.1-flash-image) 图像生成模型正式GA，可通过Gemini API投入生产使用。X：@googleaidevs ↗

4. 阶跃星辰开源Step 3.7 Flash多模态推理模型

阶跃星辰发布Step 3.7 Flash多模态推理模型，采用198B稀疏MoE架构（约11B参数激活），支持多档推理努力程度。已开放API调用，并以Apache 2.0协议开源全部权重。static.stepfun.com ↗

5. Liquid AI发布LFM2.5-8B-A1B设备端模型

Liquid AI发布LFM2.5-8B-A1B模型，拥有128K上下文。官方称其性能可媲美参数量大4倍的同类MoE模型，专为手机、笔记本等端侧设备设计。Hugging Face ↗

6. 商汤开源信息图生成模型SenseNova-U1-8B-MoT-Infographic

商汤科技发布并开源升级版信息图生成模型SenseNova-U1-8B-MoT-Infographic，在文本准确性、布局一致性等方面优化，达到开源SOTA水平。Hugging Face ↗

7. PaddlePaddle升级文档解析模型PaddleOCR-VL 1.6

PaddlePaddle发布PaddleOCR-VL 1.6模型，在OmniDocBench v1.6基准上达到96.33%，架构兼容前代，支持即插即用。X ↗

8. Qwen团队发布文生图评测基准Qwen-Image-Bench

Qwen团队推出文生图评测基准Qwen-Image-Bench及开源评分模型Q-Judger，包含56个专业创作考点，自动评分结果与人类专家高度相关。GitHub ↗

产品与工具

9. 腾讯混元发布Hy-Memory插件提升智能体长期记忆能力

腾讯混元发布专为Openclaw等长期协作型智能体打造的Hy-Memory记忆插件，通过6层记忆框架与演化链技术解决记忆碎片化问题。memory.hunyuan.tencent.com ↗

10. Mistral AI发布Search Toolkit公共预览版

Mistral AI发布Search Toolkit，这是一个用于构建AI应用生产级搜索管道的可组合框架，旨在整合分散的数据摄取、检索和评估工具，减少工程时间。mistral.ai ↗

11. Perplexity Computer集成微软Office套件

Perplexity Computer现已集成至Microsoft Excel、Word、PowerPoint和Outlook，用户可在应用侧边栏直接使用，完成文档起草、数据建模、演示制作和邮件处理。X：@perplexity_ai ↗

12. Replit Canvas：面向智能体的设计工具发布

Replit推出智能体设计工具Canvas，为用户提供空间探索想法、创建变体并进行迭代，用于构建网站、应用、营销资产等精美设计。X：@Replit ↗

13. Google推出Pay & Wallet Developer MCP server

Google发布Google Pay & Wallet Developer MCP server，作为开放标准工具，将AI开发助手和IDE安全连接到实时的API与账户上下文，方便开发者在环境中搜索文档。developers.googleblog.com：Blog ↗

14. MiniMax M2.7免费智能体编程限时开放

MiniMax宣布在OpenHandsDev平台上提供MiniMax M2.7模型的免费智能体编程体验，为限时活动。X：@MiniMax_AI ↗

15. Firecrawl发布网页变更监控功能

Firecrawl推出Monitoring功能，当监控的网页发生变动时，系统仅提取变化部分并通知智能体，官方称最高可减少90%的LLM token消耗。X ↗

16. Nous Research发布Hermes Agent v0.15.0

Nous Research发布Hermes Agent v0.15.0，新增对Opus 4.8等模型的支持及SpaceXAI集成，官方称其会话搜索速度提升达750倍。X ↗

17. OpenClaw更新v2026.5.27，包体积缩小59%

OpenClaw发布2026.5.27版本，官方称其稳定冷启动智能体轮次提速2.9倍，发布包体积缩小59%，同时收紧了运行时安全边界。openclaw.ai ↗

18. 腾讯云：MuleRun登陆阿里云市场，提供全天候AI劳动力

AI劳动力平台MuleRun登陆阿里云市场，提供研究、报告、代码、设计等服务。支持SSO、RBAC、私有网络等企业级功能，适用于个人与团队。X：@alibaba_cloud ↗

19. 微软重构Microsoft 365 Copilot，加载速度提升超50%

微软推出Microsoft 365 Copilot的全新设计方案，官方称新版应用加载速度提升超50%，并引入统一的跨应用入口，将静态提示框升级为任务感知系统。microsoft.com ↗

20. Cloudflare新增对Claude Managed Agents的支持

据InfoQ报道，Cloudflare recently added support for Claude Managed Agents，允许开发者在Cloudflare上运行和管理Claude智能体。InfoQ AI ↗

21. OpenRouter支持模型新增Flex与Priority服务层级

OpenRouter提示，用户现可为支持的模型（如OpenAI、Google Vertex等）选择Flex和Priority服务层级。定价信息请查看各模型页面。X：@OpenRouter ↗

开发与工程

22. NVIDIA开源Polar框架，大幅增强智能体编码能力

英伟达研究团队开源智能体强化学习框架Polar。该框架通过在API边界放置智能体接入GRPO训练，无需重写现有智能体执行框架。实验显示，可使Codex等模型的编码能力评分提升显著。IT之家 ↗

23. NVIDIA发布Dynamo Snapshot，K8s推理冷启动降至5秒内

NVIDIA推出Dynamo Snapshot，结合CRIU与cuda-checkpoint技术，将Kubernetes上的AI推理工作负载冷启动时间降至5秒以内。目前仅支持单GPU的vLLM与SGLang。developer.nvidia.com ↗

24. SGLang与AMD合作，使MI355X GPU运行DeepSeek-R1推理具备成本竞争力

SGLang与AMD团队合作，通过全栈优化，使AMD Instinct™ MI355X GPU在运行DeepSeek-R1大模型推理时，以每用户129 tok/s的交互延迟实现了极具竞争力的总拥有成本。lmsys.org：Blog ↗

25. Cloudflare构建统一数据平台及内部AI智能体Skipper

Cloudflare分享了构建名为Town Lake的统一分析平台的实践，并基于此平台开发了内部AI智能体Skipper。blog.cloudflare.com：Blog ↗

26. 谷歌举办Tunix黑客马拉松，社区教Gemma模型学会‘思考’

Google在Kaggle举办Tunix黑客马拉松，挑战开发者利用TPU将小型基础模型转变为通用推理引擎。获胜团队通过结合监督微调（SFT）与GRPO、SimPO等对齐技术的多阶段后训练流程实现了目标。developers.googleblog.com：Blog ↗

27. 小米分享AI Coding工程化实践：VAF、VKF与eight-claw

小米零售研发团队分享其AI Coding工程化实践，通过构建统一工作流VAF、代码知识索引工具VKF及基于飞书的协作工作台eight-claw，旨在解决AI提效局限于个体的问题，实现组织级提效与知识沉淀。微信文章 ↗

28. Antigravity CLI 1.0.3发布，支持配额耗尽后使用Google AI credits

Antigravity CLI发布1.0.3版，新增配额耗尽时启用Google AI credits的功能，同时改进了/diff体验并修复多项关键问题。X ↗

行业与公司

29. Anthropic完成650亿美元H轮融资，估值达9650亿美元

Anthropic宣布完成由Altimeter Capital领投的650亿美元H轮融资，投后估值达9650亿美元。资金将用于推进安全与可解释性研究，并扩展算力。其Claude模型企业部署持续增长，年化收入突破470亿美元。Anthropic ↗

30. OpenRouter获得1.13亿美元B轮融资

AI模型聚合平台OpenRouter宣布完成1.13亿美元B轮融资，由CapitalG领投，NVentures、ServiceNow Ventures等参投。OpenRouter ↗

31. DeepSeek计划在融资后申请科创板IPO

据消息，DeepSeek计划在完成当前约500亿美元融资轮后，立即申请科创板（A股）IPO。X：@thexpin ↗

32. Apple尝试将大型Gemini模型集成至iPhone驱动新Siri

据Ars Technica报道，Apple正尝试将Google的庞大Gemini模型集成到iPhone中以支持新Siri功能。由于模型规模大，可能需要云端组件。arstechnica.com ↗

33. 华为新麒麟芯片将于秋季发布，采用‘韬定律’新演进路径

华为何庭波提出半导体新演进路径‘韬（τ）定律’，以‘时间缩微’替代‘几何缩微’。她表示，今年秋季将发布首个完整的‘韬芯片’，新麒麟手机芯片性能、集成度相比去年将是‘跳跃性’提升。IT之家 ↗

34. Mistral AI在AI Now Summit 2026公布多项工业AI合作进展

Mistral AI在AI Now Summit 2026上宣布其工业AI解决方案‘Mistral for Industrial Engineering’整合物理模型与工程知识，正与空客、宝马集团和ASML合作。mistral.ai ↗

35. Qwen3.7-Max登顶OpenRouter热门大模型榜

阿里云宣布，其模型Qwen3.7-Max以77.3B tokens的使用量登顶OpenRouter热门大语言模型榜单。X：@alibaba_cloud ↗

36. OpenAI发布前沿治理框架，对齐欧盟及加州新规

OpenAI发布“前沿治理框架”，阐述其AI安全、安全与风险管理实践如何与欧盟和加州新出台的法规要求对齐，规范前沿模型开发与部署流程。OpenAI：官网动态 ↗

37. Sesame发布iOS应用，提供更自然的对话式AI体验

由Oculus创始人创办的AI初创公司Sesame发布其iOS应用，将对话式AI智能体带给公众，设计旨在提供更自然的来回交互体验，区别于传统聊天机器人。TechCrunch ↗

38. 豆包澄清‘听信AI致婴儿喂养不足’传闻

豆包官方回应婴儿喂养争议，指自媒体将‘每顿’造谣为‘每天’，且家长未提供完整对话背景。同时强调AI内容仅供参考，不替代医嘱。weibo.com ↗

39. Linux Foundation发布OpenMDW-1.1许可证，NVIDIA宣布采用

Linux Foundation发布专为AI模型打造的宽松许可证OpenMDW，NVIDIA宣布在Cosmos、Nemotron等多个开源模型系列中采用该框架以简化许可。openmdw.ai ↗

论文与研究

40. hexoai开源SIA框架，展示智能体递归自我改进能力

hexoai开源了SIA（自我改进AI）框架。该框架展示了AI智能体不仅优化外部工作流，还能通过任务反馈直接更新自身模型权重，在领域知识和能力上实现自主提升。X：@rohanpaul_ai ↗

41. Sakana AI提出DiffusionBlocks分块训练框架

Sakana AI提出DiffusionBlocks训练框架，将Transformer划分为多个独立块进行训练，性能与端到端训练相当。代码已开源。X ↗

42. Bagel Labs发布首个去中心化训练视频生成模型Paris 2.0

Bagel Labs团队发布Paris 2.0去中心化扩散模型，官方称这是首个去中心化训练的视频生成模型。模型权重已在Hugging Face上有限度开放。Hugging Face ↗

观点与教程

43. 萨姆·阿尔特曼和达里奥·阿莫代伊收回AI就业危机预测

Fortune报道称，OpenAI的萨姆·阿尔特曼和Anthropic的达里奥·阿莫代伊都已纷纷收回了关于AI将引发就业危机的预测。fortune.com ↗

44. AI智能体时代下的安全变革：漏洞窗口正在缩小

Lemonade CISO Jonathan Jaffe探讨AI时代安全新挑战，指出AI对攻击者和防御者同样强大，但AI能更快生成、审查和修补代码，因此漏洞窗口正在缩小。安全团队正向工程团队转型。tomtunguz.com ↗

45. 开发者分享构建pgvector驱动的向量搜索系统编码指南

本教程在Google Colab中构建完整的pgvector实验环境，展示PostgreSQL如何作为向量数据库服务现代AI应用，涵盖安装、连接、向量类型注册、语义与混合搜索等内容。marktechpost.com ↗

AI日报 · 2026-05-29