所有文章 - ephron's blog

Agent/LLM 方向学习资源 📌 置顶
项目实践与工程想找项目练手： - 得物技术 — 偏后端 - 阿里云开发者 — 企业级最佳实践，适合电商场景搜推方向的技术报告： - 美团技术团队 - 快手技术团队 - 淘天技术团队 AIGC 与多模态 - 文心团队（百度 ERNIE）— 文生文 - Seedance（字节）— 文生视频 -...

2026-05-29
AI Agent LLM 学习路径
从会回答到会查库：RAG + Text-to-SQL 智能助理实践 📌 置顶
前几年大家谈智能助理，关注点大多还在“它能不能把话说顺”。到了现在，这个标准其实已经不够了。会解释、会总结、会改写，已经变成了多数系统都能做到的基础能力。真正把差距拉开的，往往不是它会不会回答，而是它能不能把问题继续往下处理。真实业务里，很多问题天然横跨两类信息源：一边是文档、制度、说明、FAQ...

2026-05-18
AI RAG Text-to-SQL 智能助理系统设计
AI日报 · 2026-06-13
引言 > 今日AI领域模型开源持续活跃，Kimi与MiniMax分别发布代码模型和权重模型；产品端豆包上线任务模式，苹果健康App大改；开发工具方面Claude Code连发版本，Codex推出新功能。模型与能力 1. Kimi 发布并开源代码模型 Kimi-K2.7-Code > Kimi...

2026-06-13
AI日报 AI资讯人工智能
AI日报 · 2026-06-12
引言 > 今日AI领域多点开花：模型升级、应用落地与安全议题并行推进。Midjourney默认模型升级，Gemini视频任务达SOTA，Anthropic与DXC合作深化。同时，自主武器实战与AI决策风险引发关注。模型与能力 1. Midjourney V8.1 升级为默认模型 >...

2026-06-12
AI日报 AI资讯人工智能
AI日报 · 2026-06-11
引言 > 今日 AI 动态集中在模型提速、智能体落地、开发基础设施完善，以及政策与安全边界变化。模型与能力 1. Google DeepMind 开源 DiffusionGemma，文本生成提速 4 倍 > Google DeepMind 发布开源实验模型...

2026-06-11
AI日报 AI资讯人工智能
AI日报 · 2026-06-10
引言 > 今日 AI 动态集中在模型发布、编码智能体、企业应用和基础设施投入，显示能力竞争正与落地成本、治理责任同步推进。模型与能力 1. Anthropic 发布 Claude Fable 5 与 Claude Mythos 5 > Anthropic 推出 Claude Fable 5 和...

2026-06-10
AI日报 AI资讯人工智能
AI日报 · 2026-06-09
引言 > 今日 AI 动态集中在模型能力扩展、智能体产品落地、开发基础设施完善，以及安全与研究边界的再讨论。模型与能力 1. OpenBMB 发布 VoxCPM2 语音生成模型技术报告 > 面壁智能 OpenBMB 发布 2B 参数语音生成模型 VoxCPM2 技术报告。模型基于超 200...

2026-06-09
AI日报 AI资讯人工智能
AI日报 · 2026-06-08
引言 > 今日AI领域聚焦智能体搜索、本地推理加速与超应用转型，多款模型与工具发布，平台生态加速演进。模型与能力 1. Harness-1：基于强化学习训练的有状态搜索20B检索子智能体 >...

2026-06-08
AI日报 AI资讯人工智能
AI日报 · 2026-06-07
引言 > 今日AI领域模型迭代加速，Cohere、Anthropic相继推新；基础设施工具集中爆发，GitHub、OpenCV发布重要更新；安全事件频发引发关注；资本层面谷歌与xAI达成巨额算力合作。模型与能力 1. Cohere发布首个编程模型BLS-Mini-Code-1.0早期权重 >...

2026-06-07
AI日报 AI资讯人工智能
别让一篇爆款帖，替你做决定
别让一篇爆款帖，替你做决定从一次考研课程选择，谈谈信息时代的独立思考...

2026-06-06
独立思考批判性思维信息素养
AI日报 · 2026-06-06
引言 > 今日AI日报聚焦模型能力升级、产品应用落地与基础设施革新。三大方向各有突破，从可控图像生成到移动端量化，开发工具链持续完善。模型与能力 1. Riverflow 2.5：可控评分标准的图像模型 > OpenRouter上线Riverflow...

2026-06-06
AI日报 AI资讯人工智能
AI日报 · 2026-06-05
引言 > 今日AI动态覆盖模型能力跃升、产品功能创新与基础设施演进，多厂商推进智能体与多模态技术，安全与治理议题同步升温。模型与能力 1. NVIDIA Nemotron 3 Ultra：专为长时间运行 AI 智能体设计的更快推理模型 > NVIDIA 发布 Nemotron 3...

2026-06-05
AI日报 AI资讯人工智能
AI日报 · 2026-06-04
引言 > 今日AI领域迎来模型密集发布潮，Grok、Ideogram、MiniMax等多家推出重磅更新；产品与应用层面，Meta、xAI、Kimi等加速Agent落地；资本端ChatGPT月活破10亿，Suno获4亿美元融资。模型与能力 1. Grok Imagine 1.5 预览版发布，可于...

2026-06-04
AI日报 AI资讯人工智能
AI日报 · 2026-06-03
导览 > 微软在Build 2026推出首款自研推理模型MAI-Thinking-1，同时Claude Code新增动态多智能体工作流、OpenAI Codex发布可嵌入SDK——智能体编程工具链密集升级，AI正从“对话问答”加速转向“自主执行任务”。模型发布/更新 1....

2026-06-03
AI日报 AI资讯人工智能
提示词工程实战指南：三大厂共识 + 最新研究（修订版）
写好提示词，不是文学创作，是工程问题。翻完 OpenAI、Anthropic、Google 三家的官方指南，再对照 2025-2026 年的学术论文和行业实践，核心原则越来越趋同。下面把三家内容取并集，按主题整理成操作清单。每条建议标注了证据等级，方便判断可靠性： - A...

2026-06-02
AI prompt engineering 提示词 LLM
AI日报 · 2026-06-02
导览 > 今天，多家头部公司的发布将竞争焦点从模型参数规模，明确转向了支撑智能体（Agent）落地的工具调用、长期记忆与结构化数据生成等“毛细血管”能力。模型发布/更新 1. MiniMax M3：前沿编码、100万token上下文与原生多模态一体模型 > MiniMax M3...

2026-06-02
AI日报 AI资讯人工智能
AI日报 · 2026-06-01
导览 > 特斯拉的FSD用一辆量产车、一次长达6000公里的无人干预横穿测试，把自动驾驶的“可用性”门槛，一下拉到了“可信度”的新高度。模型发布/更新 1. DeepSeek V4 Flash 已上线 OpenCode Zen > DeepSeek V4 Flash 现已在 OpenCode...

2026-06-01
AI日报 AI资讯人工智能
AI日报 · 2026-05-31
导览 > 今天的关键趋势是：AI 行业的核心议题正从“追求更强”转向“如何更省”，效率与成本成为从研发到应用各环节的首要考量。模型发布/更新 1. Nano Banana Pro与Nano Banana 2正式发布 > Nano Banana Pro 与 Nano Banana 2...

2026-05-31
AI日报 AI资讯人工智能
AI日报 · 2026-05-30
导览 > 今天最明显的信号是AI工具在加速“实体化”：OpenAI的实时翻译模型开始在智能眼镜上测试，小米也开源了能给视频配音效的模型——AI正在从聊天窗口渗入我们真实的物理交互中。模型发布/更新 1. OpenAI推出实时翻译模型，支持70+语言输入 >...

2026-05-30
AI日报 AI资讯人工智能
AI日报 · 2026-05-29
今日观察 > 智能体能力成为模型竞争焦点，编码与任务执行优化密集涌现<a href="https://www.anthropic.com/news/claude-opus-4-8">[1]</a><a...

2026-05-29
AI日报 AI资讯人工智能
AI日报 · 2026-05-28
今日观察 > MCP正迅速成为主流AI工具间的通用集成协议，头部公司与新兴玩家均加速布局其安全部署与应用场景<a href="https://runwayml.com/news/mcp">[1]</a><a...

2026-05-28
AI日报 AI资讯人工智能
AI日报 · 2026-05-27
模型发布/更新 1. 面壁智能开源MiniCPM5-1B端侧模型，参数减半性能更优 > 面壁智能开源1B参数的端侧大语言模型MiniCPM5-1B，在AA-Index榜单上超越所有2B参数以下模型，INT4量化后仅0.5GB，可在手机和浏览器运行。IT之家（RSS） ↗ 2....

2026-05-27
AI日报 AI资讯人工智能
AI日报 · 2026-05-26
模型发布/更新 1. SpaceXAI完成1.5T参数Grok V9-Medium模型训练，预告开源计划 > Elon Musk宣布，1.5T参数的Grok基础模型V9-Medium已完成训练，进入微调和强化学习阶段，预计2-3周内发布，并计划年底开源0.5T参数的模型。X ↗ 2....

2026-05-26
AI日报 AI资讯人工智能
AI日报 · 2026-05-25
模型发布/更新 1. OpenClaw发布2026.5.22版本，优化性能并加固安全 > OpenClaw新版本优化了Gateway和模型启动路径，显著降低模型接口响应时间，并增强了npm包和Windows系统的安全机制。X：OpenClaw (@openclaw) ↗ 2....

2026-05-25
AI日报 AI资讯人工智能
AI日报 · 2026-05-24
模型发布/更新 1. 阶跃星辰发布 StepAudio 2.5 实时语音模型，支持副语言理解与自定义人格 > 阶跃星辰推出实时语音模型 StepAudio 2.5，可深度理解语音中的语气、语速、停顿等副语言特征。该模型支持通过 API...

2026-05-24
AI日报 AI资讯人工智能
AI日报 · 2026-05-23
模型发布/更新 1. 首个基于华为昇腾910B全栈训练的1.58比特开源模型BitCPM-CANN发布 > ModelBest、清华大学与OpenBMB社区联合发布全球首个完全基于华为昇腾910B...

2026-05-23
AI日报 AI资讯人工智能
AI日报 · 2026-05-22
模型发布/更新 1. Runway发布Aleph 2.0及Edit Studio创作套件 > Runway正式推出旗舰视频编辑模型Aleph 2.0及配套的Edit Studio工具，支持最长30秒1080p视频处理，将生成、编辑与后期制作整合于统一平台。Runway：Changelog ↗ 2....

2026-05-22
AI日报 AI资讯人工智能
AI日报 · 2026-05-21
模型发布/更新 1. Qwen3.7系列模型发布：主打Agent能力，多模态交互升级 >...

2026-05-21
AI日报 AI资讯人工智能
AI日报 · 2026-05-20
模型发布/更新 1. 谷歌I/O 2026：Gemini进入自主代理时代 > 谷歌在I/O 2026大会宣布Gemini进入自主代理时代，其新功能可自动执行复杂任务，如管理邮件、安排日程，显著提升工作效率。Google Blog：AI（RSS） ↗ 2. 谷歌发布多模态生成模型Gemini...

2026-05-20
AI日报 AI资讯人工智能
AI日报 · 2026-05-19
模型发布/更新 1. 阿里云推出HappyHorse视频生成模型 > 阿里云发布视频生成模型HappyHorse，支持从文本提示生成1080p多镜头电影级画面，并已在Model Studio上线，目前有限时8折优惠。X：阿里云 / Alibaba Cloud (@alibaba_cloud) ↗...

2026-05-19
AI日报 AI资讯人工智能
AI日报 · 2026-05-18
产品发布/更新 1. Grok Imagine图像生成功能正式发布 > Grok Imagine 现已正式发布所有人都可使用基于我们最新的文本到图像模型能够生成逼真、高质量的图像支持多种宽高比现在可在 X 上使用。X：Elon Musk ↗ 2....

2026-05-19
AI日报 AI资讯人工智能
AI日报 · 2026-05-17
模型发布/更新 1. 社区协作再创佳绩，vLLM支持万亿级模型 > 又一次Day0协作，又一次社区胜利。感谢@vllm_project团队始终可靠的支持~。X：蚂蚁百灵 ↗ 2. SANA-WM：一个用于生成1分钟720p视频的26亿级开源世界模型 >...

2026-05-17
AI日报 AI资讯人工智能
AI日报 · 2026-05-16
模型发布/更新 1. MiniMax M2.7模型上线OrcaRouter平台 > M2.7已在 OrcaRouter 平台上线，可通过单一 OpenAI 兼容 API 访问。 X：MiniMax ↗ 2....

2026-05-16
AI日报 AI资讯人工智能
AI日报 · 2026-05-15
模型发布/更新 1. SenseNova U1 技术报告发布，基于 MoE 架构开源模型权重 > 由联合创始人兼首席科学家李沐博士领导的团队发布了 SenseNova U1 技术报告，详细阐述其架构、训练方案与创新突破。此次开源同步发布了基于混合专家模型（MoE）的新权重，旨在推动 AI...

2026-05-15
AI日报 AI资讯人工智能
AI日报 · 2026-05-14
模型发布/更新 1. Hy3预览版登陆GMI，开源最强模型领跑 > Hy3 预览版现已登陆 @gmi_cloud。 X：腾讯混元 ↗ 2. Krea 2发布访问码，限量体验 > Krea 2 访问码发放，每个码可使用50次。这是Krea首个从零构建的基础模型，专注美学多样性和风格控制。...

2026-05-14
AI日报 AI资讯人工智能
打通云端 Hermes 与本地电脑：Tailscale + SSH 全攻略
让 AI Agent 真正"动手"操作你的电脑 --- 云端部署的 Hermes Agent 只能给建议，碰不到你电脑上的文件。本文介绍如何用 Tailscale + SSH 打通云端和本地，让 AI 真正帮你干活。全程约 30 分钟，包含 Tailscale 组网、Windows SSH...

2026-05-13
Hermes Tailscale SSH 教程
AI日报 · 2026-05-13
模型发布/更新 1. Claude Opus 4.7快速模式开放研究预览 > Claude Opus 4.7的快速模式现已在API和Claude Code中开放研究预览。 X：ClaudeDevs ↗ 2. Step Image Edit 2图像模型发布，性能领先且高效 > Step Image...

2026-05-13
AI日报 AI资讯人工智能
你的 API 账单，有多少是重复计算？——大模型缓存命中实战
同一个 system prompt 被反复发送 1000 次，每次都完整计算。这背后的浪费值得算一算。大模型推理有一个你可能没注意到的优化：命中缓存。简单说，如果你的 prompt 前缀跟之前某次请求一样，模型不用重新算，直接复用上次的结果。什么是命中缓存大模型推理时，prompt 中每个...

2026-05-12
LLM 缓存 API优化成本优化 Prompt Caching
让 LLM 老老实实调工具，光靠提示词不够
「算法狗」最近发了篇文章，聊怎么让 LLM 老老实实调工具。标题挺有意思：阿里 P8 问候选人这个问题，候选人答「提示词写清楚就行」，面试官笑了。问题的起点是一个查天气的例子。系统提示写了「city 必须是标准城市名，date...

2026-05-12
LLM 工具调用 Agent JSON Schema 提示词工程
Agent 路由优化：别再一刀切用大模型了
Agent 每次都调最贵的模型，但大部分请求根本用不着。这个问题我自己搭 agent 的时候也踩过——不同业务场景的简单任务比例差异很大，客服类可能 90% 是简单任务，代码生成可能反过来，不能照搬别人的比例。「卡码大模型」最近发了篇文章拆这个，给了组挺直观的数据：用户说「你好」，GPT-5.5...

2026-05-12
Agent 成本优化路由大模型
GPT-Image-2 生图提示词怎么写？拆一套结构化框架
GPT-Image-2 生图提示词怎么写？拆一套结构化框架刷到 @Berryxia.AI 发的一套 GPT-Image-2 提示词模板，读完觉得思路挺清晰，就顺手拆了一下。问题出在哪大多数人给 GPT-Image-2 的指令长这样： > 帮我画一张科技感的海报，要有AI元素 AI...

2026-05-12
GPT-Image-2 提示词工程 AI生图结构化提示词
AI日报 · 2026-05-12
模型发布/更新 1. SenseNova U1图像生成模型登陆ComfyUI平台 > 商汤SenseNova U1现已可在ComfyUI上运行，支持8步快速推理，应用场景涵盖人像、超现实艺术、文字标志等，相关资源已在Hugging Face、GitHub和Discord开放。X：商汤...

2026-05-12
AI日报 AI资讯人工智能
AI日报 · 2026-05-11
模型发布/更新 1. OpenCode x Ring 2.6 1T 限时免费开放 > OpenCode x Ring 2.6 1T 模型限时免费开放，支持 256K 上下文，具备推理能力，为纯文本模型。感谢 AntLingAGI 和 novita_labs 提供模型支持。X：opencode...

2026-05-11
AI日报 AI资讯人工智能
AI日报 · 2026-05-10
模型发布/更新 1. ERNIE 5.1 发布，预训练成本仅需对标模型 6% > 百度发布 ERNIE 5.1，基于 ERNIE 5.0 预训练基础升级了搜索、推理、知识问答、创意写作和智能体能力，预训练成本仅需对标模型的约 6%。X：百度 Baidu ↗ 2. HappyHorse...

2026-05-10
AI日报 AI资讯人工智能
Hermes Agent 命令列表
Hermes Agent 命令列表 Hermes Agent 是 Nous Research 开源的 AI Agent 框架，支持终端、消息平台和 IDE 运行。本文整理了常用的 CLI 命令和会话内斜杠命令。 CLI 命令基础操作 | 命令 | 说明 | |------|------| | |...

2026-05-06
hermes ai-agent cli commands reference
Hermes + Chrome + OpenCode：我用 AI Agent 修 bug 的工作流
Hermes + Chrome + OpenCode：我用 AI Agent 修 bug 的工作流最近在维护一个 Web 项目时，摸索出了一套用 AI Agent 定位问题、修复代码、复核验证的工作流。踩了不少坑，但也确实解决了不少用传统方式很难定位的问题。记录一下这套流程，顺便对比一下跟纯用...

2026-05-06
ai workflow opencode hermes development
一个让我研究效率翻倍的深度研究Prompt：横纵分析法拆解
最近看到 @数字生命卡兹克分享了一个他用了两年的深度研究 Prompt，号称半小时能搞懂任何陌生领域。我仔细读完后，觉得这套方法论确实有东西——不是那种"万能模板"式的心灵鸡汤，而是一套真正可操作的研究框架。 > 原文出处：分享一个我用了2年的深度研究Prompt，半小时帮你搞懂任何陌生领域...

2026-05-05
Prompt Engineering 深度研究方法论 AI工具
6 款 AI 模型 iOS 开发能力深度评测：谁能帮你写出可靠的 Swift 6 代码？
6 款 AI 模型 iOS 开发能力深度评测：谁能帮你写出可靠的 Swift 6 代码？ > 数据来源：@solidus > 评测日期：2026-04-30 > 被测模型：Claude Opus 4.7 max / Claude Sonnet 4.6 high / DeepSeek V4 /...

2026-05-04
二手交易防骗指南
六年前我写过一篇二手防骗文，那时候骗子的套路还比较直接——低价诱惑加脱离平台，两招打天下。现在闲鱼月活已经超过两亿，骗子这套东西也升级了好几轮，“看芝麻信用”“不要脱离平台”已经是最低门槛，真正让人吃亏的，是那些看起来完全正常的交易流程。...

2026-04-29
闲鱼二手交易防骗
别卷了，上科技！用AI助力你拿下offer
来源：小黑盒 · 作者：裘卓明 Lv.17 --- 作者的核心思路是把AI辅助求职做成一个系统化流程，类似玩游戏做任务：查wiki（拆解JD）→ 调整装备（优化简历）→ 模拟训练（面试对练）→ 收集情报（公司背调）→ 结算抽卡（薪资沟通）。第一步：拆解岗位要求...

2026-04-29
求职 AI 面试简历
文档驱动的 API 接口同步：CSQAQ Market Lookup 技术解析
1 引言接入第三方 API 时，最麻烦的往往不是写调用代码，而是搞清楚"有哪些接口、路径是什么、参数怎么传"。传统做法是维护一份静态文档，但文档和实际接口之间容易脱节——接口改了路径、换了参数名，文档没同步，调用就废了。 docs.csqaq.com 提供了 39 个 API...

2026-04-22
Python API 工具 OpenAPI
上下文门控器：纯规则方法实现多轮对话上下文选择
1 引言大语言模型在多轮对话中面临两个核心问题：上下文污染：随着对话进行，历史内容容易混入当前回答。例如前 50 轮讨论 Redis，第 51 轮突然问 Git，模型的回答仍可能受到 Redis 上下文的影响。上下文膨胀：对话一长，token 快速增长，context window...

2026-04-22
LLM Python 上下文管理检索
OpenClaw 命令列表
| 类型 | 主命令 | 参数 / 别名 | 说明 | |---|---|---|---| | 文本 + 原生（启用时） | | — | 显示帮助；也是 inline shortcut | | 文本 + 原生（启用时） | | — | 列出命令；也是 inline shortcut | | 文本...

2026-03-21
【数据结构】算法效率的度量
在计算机科学中，我们需要比较不同算法的效率。衡量算法效率通常从时间复杂度和空间复杂度两个方面进行。一、时间复杂度时间复杂度表示： > 算法执行时间随问题规模 n 增长的变化趋势。常见的时间复杂度： | 复杂度 | 示例 | | ---------- | ---- | | O(1)...

2026-03-04
数据结构算法时间复杂度考研408

数据结构
OpenClaw 节省 90% Token 的完整优化指南：从输入、调用到模型策略
很多人刚开始用 OpenClaw 的时候，都会遇到一个问题：Token 消耗得特别快。明明只是聊了几轮，账单就蹭蹭往上涨。为什么会这样呢？其实，要理解 Token 消耗，我们可以用一个简单的公式来理解： > Token消耗 = (输入 + 输出) × 调用次数 × 模型价格...

2026-03-01
OpenClaw
【故障复盘】Docker 容器挖矿木马排查记录 (Dify)
问题标签：问题描述： Linux 服务器 CPU 占用率长期维持在 100% 以上，存在无法彻底杀死的异常进程。 --- 一、异常现象 (Symptoms) 1. CPU 报警：命令显示 CPU 使用率极高（如 700%+）。 2. 顽固进程：发现名为、...

2026-01-16
运维安全 Docker Dify 挖矿木马