模型发布/更新
1. MiniMax M2.7模型上线OrcaRouter平台
M2.7已在 OrcaRouter 平台上线,可通过单一 OpenAI 兼容 API 访问。 X:MiniMax ↗
2. SenseNova发布增强版信息图表生成模型SenseNova-U1-8B-MoT-Infographic
SenseNova近日推出专为信息图表生成设计的增强模型SenseNova-U1-8B-MoT-Infographic。该模型能够根据指令生成多种视觉格式内容,包括海报、图表、食谱卡、明信片以及学术风格的arXiv页面等。在性能方面,模型在BizGenEval(困难版)和IGenBench(Q-ACC)两项基准测试上表现突出,相比其基础U1模型分别提升了6.8分和18.2分。目前,该模型已在Hugging Face平台开源,并提供了超过100个多样化的生成示例,供开发者和研究者参考与试用。 X:商汤 SenseTime ↗
3. 蚂蚁开源图像分割模型 ARGenSeg-8B
包容性AI团队发布ARGenSeg-8B模型,致力于通过开源和开放科学推动人工智能的进步与普及。该举措强调技术民主化,使更广泛的社区能够参与AI研发与应用。开源策略将促进协作创新,加速AI工具在多元场景中的落地,降低技术门槛,推动产业生态的开放发展。 蚂蚁 inclusionAI:HuggingFace 新模型 ↗
产品发布/更新
4. Runway Agent一键生成完整广告
Runway Agent 让你仅需一次会话,就能从产品照片和想法转变为完全制作完成的广告。 X:Runway ↗
5. Krea 2正式上线面向专业用户
从今天起,Krea 2 正式为 Pro 用户上线。 X:Krea AI ↗
6. X平台开源"For You"信息流推荐算法
X平台在GitHub开源了其"For You"信息流的最新推荐算法。该算法融合来自已关注账号的内容和通过相似性搜索发现的网络外内容,并利用基于Grok架构的Phoenix Transformer模型进行统一评分。模型通过分析用户近期互动,同时预测点赞、回复、转发等多种互动概率,并综合成最终相关性分数。排序过程包括候选内容收集、上下文信息补充、AI模型评分、多样性调整及垃圾信息过滤等步骤。此次开源提供了完整的可运行管道、预训练模型、内容理解服务及内置广告混合模块,核心计算完全由Transformer模型驱动。 X:cb_doge ↗
7. 语义代码审查工具clawpatch发布
语义代码审查工具 clawpatch 0.1.0 发布,将代码库映射成语义功能切片,自动审查错误和质量问题,并记录经过验证的修复方案。 X:Peter Steinberger ↗
8. OpenRouter BYOK三大升级 支持多密钥轮换
OpenRouter BYOK 三项重大升级,可在同一工作空间为同一服务商添加多个密钥并设置调用顺序,便于在速率限制间轮换、区分开发与生产凭证,或在团队账户间分配使用量。 X:OpenRouter ↗
9. 开源3D生成工具包:单张图片快速构建可交互3D世界
开发者开源了一套专为 Claude Code 设计的完整 3D 生成工具包,能将单张图片自动拆解,生成包含环境、网格、物理、灯光和音频的全套可交互 3D 场景。将以往需数天的 2D 转 3D 工作流程缩短至几分钟,适用于游戏开发、世界构建和产品可视化等项目。 X:Berry Xia ↗
10. 将Grok接入Hermes智能体
xAI宣布,用户现可将Grok订阅账户接入Nous Research的开源自改进智能体Hermes Agent。该集成对所有订阅层级开放,允许用户在Hermes环境中直接使用Grok 4.3进行文本对话与高级推理、调用其文本转语音功能生成语音回复,并利用Grok Imagine创建图像与视频。 xAI:News ↗
11. ChatGPT 推出全新个人理财体验
OpenAI 为美国地区的 ChatGPT Pro 用户推出个人理财功能预览版。用户可安全连接个人金融账户,获取基于自身财务状况、目标和优先级生成的 AI 洞察与指导。 OpenAI:官网动态 ↗
行业动态
12. Anthropic估值与营收飙升
据 FT 报道,Anthropic 估值从 2026 年 2 月的 3500 亿美元飙升至 5 月的 9000 亿美元,三个月增长近 3 倍;年度经常性收入从 2025 年底的 90 亿美元增至 2026 年 5 月的 450 亿美元,五个月增长近 5 倍。 X:Kim ↗
13. 为 OpenAI 累计投入超 1000 亿美元,纳德拉称微软当年投资时"没人愿意下注"
在"马斯克诉奥尔特曼"庭审中,微软企业发展负责人确认,微软对OpenAI的累计投入已超过1000亿美元,其中包括130亿美元原始投资及大量Azure基础设施成本。此次合作已为微软带来约300亿美元营收。CEO纳德拉表示,微软是在"没人愿意下注"时承担了风险。双方已续签非独家协议,微软不再支付收入分成,并将OpenAI的分成上限设为到2030年累计380亿美元。 IT之家 ↗
14. 英国多部门联合警告:AI模型网络攻击能力已远超专业人员
英国财政部、英格兰银行及金融行为监管局联合警告,当前最先进的AI模型已具备远超普通专业人员的网络攻击能力,其攻击速度更快、范围更广、成本更低。若被恶意利用,将严重威胁企业运营安全、客户数据、金融市场稳定性乃至整个金融体系。 IT之家 ↗
15. 微软研究院发布AI新工具与模型
微软研究院发布多项新工具与模型,涵盖 MagenticLite、智能体化 GitHub 工作流、验证优先智能体、意义匹配微调等方向,面向 AI 与智能体开发者开放。 X:Microsoft Research ↗
16. 戛纳倒计时 | Kling AI大会主讲阵容揭晓
2026年戛纳电影节Kling AI大会将汇聚三位世界级电影制作人,展示他们运用Kling AI技术创作的标杆作品。活动定于2026年5月18日15:30至17:30,在戛纳影节宫主舞台举行。 X:可灵 Kling AI ↗
技巧与观点
17. WhichLLM:根据基准测试为硬件推荐最佳本地LLM
开源工具WhichLLM可根据用户硬件配置推荐最适合的本地大语言模型,通过基准测试对各类模型进行排名,帮助用户依据自身设备性能选择最优模型。项目在Hacker News上获得116点热度。 Hacker News 热门 ↗
18. 飞书开源CLI工具45天获万星,AI操作可见可控引关注
飞书开源命令行工具lark-cli在45天内获得超过1万GitHub star,成为国内首个破万星的办公套件开源项目。该工具允许AI通过命令行直接操作飞书,每一步操作都可预览、可审查。 X:阿易 AI Notes ↗
19. 牛津博士后开源视频翻译工具Violin
牛津大学博士后Kevin Lin开源视频翻译工具Violin,将语音识别、大语言模型翻译与语音合成整合为自动化流水线,支持多语言互译与个性化翻译风格调整,所有功能基于MIT协议开源。 X:Berry Xia ↗
20. OpenSquilla:智能路由降低AI成本近十倍
开源项目OpenSquilla通过智能路由架构,在保持相近性能的同时将复杂AI任务处理成本从6美元降至0.68美元。其核心是将简单任务分配给廉价模型,仅复杂任务调用顶级模型。兼容OpenAI、Claude、Gemini、DeepSeek等20余家主流模型。 X:小互 ↗
21. 用百个AI实例自动化驱动开源项目
作者在 OpenClaw 项目中持续运行约 100 个 Codex 实例,自动化处理代码审查、议题去重归类、测试环境重现、会议讨论自动创建任务、垃圾评论过滤及性能回归监控等核心工作。 X:Peter Steinberger ↗
22. 推理的一阶导数:AI浪潮下的增长逻辑
AI推理是当今规模最大、增长最快的技术市场,预计七年内将达到2500亿美元。Datadog和Twilio作为"推理的一阶导数"脱颖而出,当前周期呈现高度集中特点,少数客户能驱动巨大收益。 Tomer Tunguz 博客 ↗
23. 英伟达CEO称技工前景优于计算机科学毕业生
英伟达CEO Jensen Huang在卡内基梅隆大学告诉2026届毕业生,电工、水管工等技工比计算机科学毕业生更有前景。数据支持这一观点:技工需求增长是白领职位的三倍,机器人技术员职位增长107%。 X:Kim ↗
24. 杨立昆访谈:剖析LLM局限,畅谈AI未来与创业新途
AI先驱杨立昆在播客中阐述了对大型语言模型局限性的反主流观点,解释了离开Meta的原因,建议博士生停止研究LLM,并分享了对AI安全、突破性研究发生机制的尖锐见解。 X:Yann LeCun ↗
评论 (0)
发表评论
请先登录后发表评论