今日观察
智能体能力成为模型竞争焦点,编码与任务执行优化密集涌现[1][2][9][16][29]。
模型向端侧与轻量化部署加速,设备端推理与专用芯片布局活跃[5][23][31]。
模型发布/更新
1. Anthropic发布Claude Opus 4.8模型,编码与智能体能力显著提升
Anthropic推出Claude Opus 4.8,在编码、智能体任务、推理等基准测试中全面进步。该模型已上线各大平台,API定价不变,Fast模式降价约三分之二并提速。同步推出Claude Code动态工作流功能,支持并行调度数百子智能…Anthropic ↗
2. xAI发布Grok Build 0.1,专为智能体编码优化
xAI通过API公开测试其新编码模型Grok Build 0.1。该模型专为智能体编码任务训练,支持网页开发、调试和MCP,驱动Grok Build CLI。推理速度超过100 tokens/秒。x.ai ↗
3. Google正式发布Nano Banana系列图像生成模型
Google宣布Nano Banana Pro (gemini-3-pro-image) 和 Nano Banana 2 (gemini-3.1-flash-image) 图像生成模型正式GA,可通过Gemini API投入生产使用。X:@googleaidevs ↗
4. 阶跃星辰开源Step 3.7 Flash多模态推理模型
阶跃星辰发布Step 3.7 Flash多模态推理模型,采用198B稀疏MoE架构(约11B参数激活),支持多档推理努力程度。已开放API调用,并以Apache 2.0协议开源全部权重。static.stepfun.com ↗
5. Liquid AI发布LFM2.5-8B-A1B设备端模型
Liquid AI发布LFM2.5-8B-A1B模型,拥有128K上下文。官方称其性能可媲美参数量大4倍的同类MoE模型,专为手机、笔记本等端侧设备设计。Hugging Face ↗
6. 商汤开源信息图生成模型SenseNova-U1-8B-MoT-Infographic
商汤科技发布并开源升级版信息图生成模型SenseNova-U1-8B-MoT-Infographic,在文本准确性、布局一致性等方面优化,达到开源SOTA水平。Hugging Face ↗
7. PaddlePaddle升级文档解析模型PaddleOCR-VL 1.6
PaddlePaddle发布PaddleOCR-VL 1.6模型,在OmniDocBench v1.6基准上达到96.33%,架构兼容前代,支持即插即用。X ↗
8. Qwen团队发布文生图评测基准Qwen-Image-Bench
Qwen团队推出文生图评测基准Qwen-Image-Bench及开源评分模型Q-Judger,包含56个专业创作考点,自动评分结果与人类专家高度相关。GitHub ↗
产品与工具
9. 腾讯混元发布Hy-Memory插件提升智能体长期记忆能力
腾讯混元发布专为Openclaw等长期协作型智能体打造的Hy-Memory记忆插件,通过6层记忆框架与演化链技术解决记忆碎片化问题。memory.hunyuan.tencent.com ↗
10. Mistral AI发布Search Toolkit公共预览版
Mistral AI发布Search Toolkit,这是一个用于构建AI应用生产级搜索管道的可组合框架,旨在整合分散的数据摄取、检索和评估工具,减少工程时间。mistral.ai ↗
11. Perplexity Computer集成微软Office套件
Perplexity Computer现已集成至Microsoft Excel、Word、PowerPoint和Outlook,用户可在应用侧边栏直接使用,完成文档起草、数据建模、演示制作和邮件处理。X:@perplexity_ai ↗
12. Replit Canvas:面向智能体的设计工具发布
Replit推出智能体设计工具Canvas,为用户提供空间探索想法、创建变体并进行迭代,用于构建网站、应用、营销资产等精美设计。X:@Replit ↗
13. Google推出Pay & Wallet Developer MCP server
Google发布Google Pay & Wallet Developer MCP server,作为开放标准工具,将AI开发助手和IDE安全连接到实时的API与账户上下文,方便开发者在环境中搜索文档。developers.googleblog.com:Blog ↗
14. MiniMax M2.7免费智能体编程限时开放
MiniMax宣布在OpenHandsDev平台上提供MiniMax M2.7模型的免费智能体编程体验,为限时活动。X:@MiniMax_AI ↗
15. Firecrawl发布网页变更监控功能
Firecrawl推出Monitoring功能,当监控的网页发生变动时,系统仅提取变化部分并通知智能体,官方称最高可减少90%的LLM token消耗。X ↗
16. Nous Research发布Hermes Agent v0.15.0
Nous Research发布Hermes Agent v0.15.0,新增对Opus 4.8等模型的支持及SpaceXAI集成,官方称其会话搜索速度提升达750倍。X ↗
17. OpenClaw更新v2026.5.27,包体积缩小59%
OpenClaw发布2026.5.27版本,官方称其稳定冷启动智能体轮次提速2.9倍,发布包体积缩小59%,同时收紧了运行时安全边界。openclaw.ai ↗
18. 腾讯云:MuleRun登陆阿里云市场,提供全天候AI劳动力
AI劳动力平台MuleRun登陆阿里云市场,提供研究、报告、代码、设计等服务。支持SSO、RBAC、私有网络等企业级功能,适用于个人与团队。X:@alibaba_cloud ↗
19. 微软重构Microsoft 365 Copilot,加载速度提升超50%
微软推出Microsoft 365 Copilot的全新设计方案,官方称新版应用加载速度提升超50%,并引入统一的跨应用入口,将静态提示框升级为任务感知系统。microsoft.com ↗
20. Cloudflare新增对Claude Managed Agents的支持
据InfoQ报道,Cloudflare recently added support for Claude Managed Agents,允许开发者在Cloudflare上运行和管理Claude智能体。InfoQ AI ↗
21. OpenRouter支持模型新增Flex与Priority服务层级
OpenRouter提示,用户现可为支持的模型(如OpenAI、Google Vertex等)选择Flex和Priority服务层级。定价信息请查看各模型页面。X:@OpenRouter ↗
开发与工程
22. NVIDIA开源Polar框架,大幅增强智能体编码能力
英伟达研究团队开源智能体强化学习框架Polar。该框架通过在API边界放置智能体接入GRPO训练,无需重写现有智能体执行框架。实验显示,可使Codex等模型的编码能力评分提升显著。IT之家 ↗
23. NVIDIA发布Dynamo Snapshot,K8s推理冷启动降至5秒内
NVIDIA推出Dynamo Snapshot,结合CRIU与cuda-checkpoint技术,将Kubernetes上的AI推理工作负载冷启动时间降至5秒以内。目前仅支持单GPU的vLLM与SGLang。developer.nvidia.com ↗
24. SGLang与AMD合作,使MI355X GPU运行DeepSeek-R1推理具备成本竞争力
SGLang与AMD团队合作,通过全栈优化,使AMD Instinct™ MI355X GPU在运行DeepSeek-R1大模型推理时,以每用户129 tok/s的交互延迟实现了极具竞争力的总拥有成本。lmsys.org:Blog ↗
25. Cloudflare构建统一数据平台及内部AI智能体Skipper
Cloudflare分享了构建名为Town Lake的统一分析平台的实践,并基于此平台开发了内部AI智能体Skipper。blog.cloudflare.com:Blog ↗
26. 谷歌举办Tunix黑客马拉松,社区教Gemma模型学会‘思考’
Google在Kaggle举办Tunix黑客马拉松,挑战开发者利用TPU将小型基础模型转变为通用推理引擎。获胜团队通过结合监督微调(SFT)与GRPO、SimPO等对齐技术的多阶段后训练流程实现了目标。developers.googleblog.com:Blog ↗
27. 小米分享AI Coding工程化实践:VAF、VKF与eight-claw
小米零售研发团队分享其AI Coding工程化实践,通过构建统一工作流VAF、代码知识索引工具VKF及基于飞书的协作工作台eight-claw,旨在解决AI提效局限于个体的问题,实现组织级提效与知识沉淀。微信文章 ↗
28. Antigravity CLI 1.0.3发布,支持配额耗尽后使用Google AI credits
Antigravity CLI发布1.0.3版,新增配额耗尽时启用Google AI credits的功能,同时改进了/diff体验并修复多项关键问题。X ↗
行业与公司
29. Anthropic完成650亿美元H轮融资,估值达9650亿美元
Anthropic宣布完成由Altimeter Capital领投的650亿美元H轮融资,投后估值达9650亿美元。资金将用于推进安全与可解释性研究,并扩展算力。其Claude模型企业部署持续增长,年化收入突破470亿美元。Anthropic ↗
30. OpenRouter获得1.13亿美元B轮融资
AI模型聚合平台OpenRouter宣布完成1.13亿美元B轮融资,由CapitalG领投,NVentures、ServiceNow Ventures等参投。OpenRouter ↗
31. DeepSeek计划在融资后申请科创板IPO
据消息,DeepSeek计划在完成当前约500亿美元融资轮后,立即申请科创板(A股)IPO。X:@thexpin ↗
32. Apple尝试将大型Gemini模型集成至iPhone驱动新Siri
据Ars Technica报道,Apple正尝试将Google的庞大Gemini模型集成到iPhone中以支持新Siri功能。由于模型规模大,可能需要云端组件。arstechnica.com ↗
33. 华为新麒麟芯片将于秋季发布,采用‘韬定律’新演进路径
华为何庭波提出半导体新演进路径‘韬(τ)定律’,以‘时间缩微’替代‘几何缩微’。她表示,今年秋季将发布首个完整的‘韬芯片’,新麒麟手机芯片性能、集成度相比去年将是‘跳跃性’提升。IT之家 ↗
34. Mistral AI在AI Now Summit 2026公布多项工业AI合作进展
Mistral AI在AI Now Summit 2026上宣布其工业AI解决方案‘Mistral for Industrial Engineering’整合物理模型与工程知识,正与空客、宝马集团和ASML合作。mistral.ai ↗
35. Qwen3.7-Max登顶OpenRouter热门大模型榜
阿里云宣布,其模型Qwen3.7-Max以77.3B tokens的使用量登顶OpenRouter热门大语言模型榜单。X:@alibaba_cloud ↗
36. OpenAI发布前沿治理框架,对齐欧盟及加州新规
OpenAI发布“前沿治理框架”,阐述其AI安全、安全与风险管理实践如何与欧盟和加州新出台的法规要求对齐,规范前沿模型开发与部署流程。OpenAI:官网动态 ↗
37. Sesame发布iOS应用,提供更自然的对话式AI体验
由Oculus创始人创办的AI初创公司Sesame发布其iOS应用,将对话式AI智能体带给公众,设计旨在提供更自然的来回交互体验,区别于传统聊天机器人。TechCrunch ↗
38. 豆包澄清‘听信AI致婴儿喂养不足’传闻
豆包官方回应婴儿喂养争议,指自媒体将‘每顿’造谣为‘每天’,且家长未提供完整对话背景。同时强调AI内容仅供参考,不替代医嘱。weibo.com ↗
39. Linux Foundation发布OpenMDW-1.1许可证,NVIDIA宣布采用
Linux Foundation发布专为AI模型打造的宽松许可证OpenMDW,NVIDIA宣布在Cosmos、Nemotron等多个开源模型系列中采用该框架以简化许可。openmdw.ai ↗
论文与研究
40. hexoai开源SIA框架,展示智能体递归自我改进能力
hexoai开源了SIA(自我改进AI)框架。该框架展示了AI智能体不仅优化外部工作流,还能通过任务反馈直接更新自身模型权重,在领域知识和能力上实现自主提升。X:@rohanpaul_ai ↗
41. Sakana AI提出DiffusionBlocks分块训练框架
Sakana AI提出DiffusionBlocks训练框架,将Transformer划分为多个独立块进行训练,性能与端到端训练相当。代码已开源。X ↗
42. Bagel Labs发布首个去中心化训练视频生成模型Paris 2.0
Bagel Labs团队发布Paris 2.0去中心化扩散模型,官方称这是首个去中心化训练的视频生成模型。模型权重已在Hugging Face上有限度开放。Hugging Face ↗
观点与教程
43. 萨姆·阿尔特曼和达里奥·阿莫代伊收回AI就业危机预测
Fortune报道称,OpenAI的萨姆·阿尔特曼和Anthropic的达里奥·阿莫代伊都已纷纷收回了关于AI将引发就业危机的预测。fortune.com ↗
44. AI智能体时代下的安全变革:漏洞窗口正在缩小
Lemonade CISO Jonathan Jaffe探讨AI时代安全新挑战,指出AI对攻击者和防御者同样强大,但AI能更快生成、审查和修补代码,因此漏洞窗口正在缩小。安全团队正向工程团队转型。tomtunguz.com ↗
45. 开发者分享构建pgvector驱动的向量搜索系统编码指南
本教程在Google Colab中构建完整的pgvector实验环境,展示PostgreSQL如何作为向量数据库服务现代AI应用,涵盖安装、连接、向量类型注册、语义与混合搜索等内容。marktechpost.com ↗
评论 (0)
发表评论
请先登录后发表评论