ephron's blog
主页 博客 画布 提示词 未登录

所有文章

共 56 篇文章

  • Agent/LLM 方向学习资源 📌 置顶

    项目实践与工程 想找项目练手: - 得物技术 — 偏后端 - 阿里云开发者 — 企业级最佳实践,适合电商场景 搜推方向的技术报告: - 美团技术团队 - 快手技术团队 - 淘天技术团队 AIGC 与多模态 - 文心团队(百度 ERNIE)— 文生文 - Seedance(字节)— 文生视频 -...

    2026-05-29
    AI Agent LLM 学习路径
  • 从会回答到会查库:RAG + Text-to-SQL 智能助理实践 📌 置顶

    前几年大家谈智能助理,关注点大多还在“它能不能把话说顺”。到了现在,这个标准其实已经不够了。会解释、会总结、会改写,已经变成了多数系统都能做到的基础能力。真正把差距拉开的,往往不是它会不会回答,而是它能不能把问题继续往下处理。 真实业务里,很多问题天然横跨两类信息源:一边是文档、制度、说明、FAQ...

    2026-05-18
    AI RAG Text-to-SQL 智能助理 系统设计
  • AI日报 · 2026-06-13

    引言 > 今日AI领域模型开源持续活跃,Kimi与MiniMax分别发布代码模型和权重模型;产品端豆包上线任务模式,苹果健康App大改;开发工具方面Claude Code连发版本,Codex推出新功能。 模型与能力 1. Kimi 发布并开源代码模型 Kimi-K2.7-Code > Kimi...

    2026-06-13
    AI日报 AI资讯 人工智能
  • AI日报 · 2026-06-12

    引言 > 今日AI领域多点开花:模型升级、应用落地与安全议题并行推进。Midjourney默认模型升级,Gemini视频任务达SOTA,Anthropic与DXC合作深化。同时,自主武器实战与AI决策风险引发关注。 模型与能力 1. Midjourney V8.1 升级为默认模型 >...

    2026-06-12
    AI日报 AI资讯 人工智能
  • AI日报 · 2026-06-11

    引言 > 今日 AI 动态集中在模型提速、智能体落地、开发基础设施完善,以及政策与安全边界变化。 模型与能力 1. Google DeepMind 开源 DiffusionGemma,文本生成提速 4 倍 > Google DeepMind 发布开源实验模型...

    2026-06-11
    AI日报 AI资讯 人工智能
  • AI日报 · 2026-06-10

    引言 > 今日 AI 动态集中在模型发布、编码智能体、企业应用和基础设施投入,显示能力竞争正与落地成本、治理责任同步推进。 模型与能力 1. Anthropic 发布 Claude Fable 5 与 Claude Mythos 5 > Anthropic 推出 Claude Fable 5 和...

    2026-06-10
    AI日报 AI资讯 人工智能
  • AI日报 · 2026-06-09

    引言 > 今日 AI 动态集中在模型能力扩展、智能体产品落地、开发基础设施完善,以及安全与研究边界的再讨论。 模型与能力 1. OpenBMB 发布 VoxCPM2 语音生成模型技术报告 > 面壁智能 OpenBMB 发布 2B 参数语音生成模型 VoxCPM2 技术报告。模型基于超 200...

    2026-06-09
    AI日报 AI资讯 人工智能
  • AI日报 · 2026-06-08

    引言 > 今日AI领域聚焦智能体搜索、本地推理加速与超应用转型,多款模型与工具发布,平台生态加速演进。 模型与能力 1. Harness-1:基于强化学习训练的有状态搜索20B检索子智能体 >...

    2026-06-08
    AI日报 AI资讯 人工智能
  • AI日报 · 2026-06-07

    引言 > 今日AI领域模型迭代加速,Cohere、Anthropic相继推新;基础设施工具集中爆发,GitHub、OpenCV发布重要更新;安全事件频发引发关注;资本层面谷歌与xAI达成巨额算力合作。 模型与能力 1. Cohere发布首个编程模型BLS-Mini-Code-1.0早期权重 >...

    2026-06-07
    AI日报 AI资讯 人工智能
  • 别让一篇爆款帖,替你做决定

    别让一篇爆款帖,替你做决定 从一次考研课程选择,谈谈信息时代的独立思考...

    2026-06-06
    独立思考 批判性思维 信息素养
  • AI日报 · 2026-06-06

    引言 > 今日AI日报聚焦模型能力升级、产品应用落地与基础设施革新。三大方向各有突破,从可控图像生成到移动端量化,开发工具链持续完善。 模型与能力 1. Riverflow 2.5:可控评分标准的图像模型 > OpenRouter上线Riverflow...

    2026-06-06
    AI日报 AI资讯 人工智能
  • AI日报 · 2026-06-05

    引言 > 今日AI动态覆盖模型能力跃升、产品功能创新与基础设施演进,多厂商推进智能体与多模态技术,安全与治理议题同步升温。 模型与能力 1. NVIDIA Nemotron 3 Ultra:专为长时间运行 AI 智能体设计的更快推理模型 > NVIDIA 发布 Nemotron 3...

    2026-06-05
    AI日报 AI资讯 人工智能
  • AI日报 · 2026-06-04

    引言 > 今日AI领域迎来模型密集发布潮,Grok、Ideogram、MiniMax等多家推出重磅更新;产品与应用层面,Meta、xAI、Kimi等加速Agent落地;资本端ChatGPT月活破10亿,Suno获4亿美元融资。 模型与能力 1. Grok Imagine 1.5 预览版发布,可于...

    2026-06-04
    AI日报 AI资讯 人工智能
  • AI日报 · 2026-06-03

    导览 > 微软在Build 2026推出首款自研推理模型MAI-Thinking-1,同时Claude Code新增动态多智能体工作流、OpenAI Codex发布可嵌入SDK——智能体编程工具链密集升级,AI正从“对话问答”加速转向“自主执行任务”。 模型发布/更新 1....

    2026-06-03
    AI日报 AI资讯 人工智能
  • 提示词工程实战指南:三大厂共识 + 最新研究(修订版)

    写好提示词,不是文学创作,是工程问题。 翻完 OpenAI、Anthropic、Google 三家的官方指南,再对照 2025-2026 年的学术论文和行业实践,核心原则越来越趋同。下面把三家内容取并集,按主题整理成操作清单。 每条建议标注了证据等级,方便判断可靠性: - A...

    2026-06-02
    AI prompt engineering 提示词 LLM
  • AI日报 · 2026-06-02

    导览 > 今天,多家头部公司的发布将竞争焦点从模型参数规模,明确转向了支撑智能体(Agent)落地的工具调用、长期记忆与结构化数据生成等“毛细血管”能力。 模型发布/更新 1. MiniMax M3:前沿编码、100万token上下文与原生多模态一体模型 > MiniMax M3...

    2026-06-02
    AI日报 AI资讯 人工智能
  • AI日报 · 2026-06-01

    导览 > 特斯拉的FSD用一辆量产车、一次长达6000公里的无人干预横穿测试,把自动驾驶的“可用性”门槛,一下拉到了“可信度”的新高度。 模型发布/更新 1. DeepSeek V4 Flash 已上线 OpenCode Zen > DeepSeek V4 Flash 现已在 OpenCode...

    2026-06-01
    AI日报 AI资讯 人工智能
  • AI日报 · 2026-05-31

    导览 > 今天的关键趋势是:AI 行业的核心议题正从“追求更强”转向“如何更省”,效率与成本成为从研发到应用各环节的首要考量。 模型发布/更新 1. Nano Banana Pro与Nano Banana 2正式发布 > Nano Banana Pro 与 Nano Banana 2...

    2026-05-31
    AI日报 AI资讯 人工智能
  • AI日报 · 2026-05-30

    导览 > 今天最明显的信号是AI工具在加速“实体化”:OpenAI的实时翻译模型开始在智能眼镜上测试,小米也开源了能给视频配音效的模型——AI正在从聊天窗口渗入我们真实的物理交互中。 模型发布/更新 1. OpenAI推出实时翻译模型,支持70+语言输入 >...

    2026-05-30
    AI日报 AI资讯 人工智能
  • AI日报 · 2026-05-29

    今日观察 > 智能体能力成为模型竞争焦点,编码与任务执行优化密集涌现<sup><a href="https://www.anthropic.com/news/claude-opus-4-8">[1]</a></sup><sup><a...

    2026-05-29
    AI日报 AI资讯 人工智能
  • AI日报 · 2026-05-28

    今日观察 > MCP正迅速成为主流AI工具间的通用集成协议,头部公司与新兴玩家均加速布局其安全部署与应用场景<sup><a href="https://runwayml.com/news/mcp">[1]</a></sup><sup><a...

    2026-05-28
    AI日报 AI资讯 人工智能
  • AI日报 · 2026-05-27

    模型发布/更新 1. 面壁智能开源MiniCPM5-1B端侧模型,参数减半性能更优 > 面壁智能开源1B参数的端侧大语言模型MiniCPM5-1B,在AA-Index榜单上超越所有2B参数以下模型,INT4量化后仅0.5GB,可在手机和浏览器运行。IT之家(RSS) ↗ 2....

    2026-05-27
    AI日报 AI资讯 人工智能
  • AI日报 · 2026-05-26

    模型发布/更新 1. SpaceXAI完成1.5T参数Grok V9-Medium模型训练,预告开源计划 > Elon Musk宣布,1.5T参数的Grok基础模型V9-Medium已完成训练,进入微调和强化学习阶段,预计2-3周内发布,并计划年底开源0.5T参数的模型。X ↗ 2....

    2026-05-26
    AI日报 AI资讯 人工智能
  • AI日报 · 2026-05-25

    模型发布/更新 1. OpenClaw发布2026.5.22版本,优化性能并加固安全 > OpenClaw新版本优化了Gateway和模型启动路径,显著降低模型接口响应时间,并增强了npm包和Windows系统的安全机制。X:OpenClaw (@openclaw) ↗ 2....

    2026-05-25
    AI日报 AI资讯 人工智能
  • AI日报 · 2026-05-24

    模型发布/更新 1. 阶跃星辰发布 StepAudio 2.5 实时语音模型,支持副语言理解与自定义人格 > 阶跃星辰推出实时语音模型 StepAudio 2.5,可深度理解语音中的语气、语速、停顿等副语言特征。该模型支持通过 API...

    2026-05-24
    AI日报 AI资讯 人工智能
  • AI日报 · 2026-05-23

    模型发布/更新 1. 首个基于华为昇腾910B全栈训练的1.58比特开源模型BitCPM-CANN发布 > ModelBest、清华大学与OpenBMB社区联合发布全球首个完全基于华为昇腾910B...

    2026-05-23
    AI日报 AI资讯 人工智能
  • AI日报 · 2026-05-22

    模型发布/更新 1. Runway发布Aleph 2.0及Edit Studio创作套件 > Runway正式推出旗舰视频编辑模型Aleph 2.0及配套的Edit Studio工具,支持最长30秒1080p视频处理,将生成、编辑与后期制作整合于统一平台。Runway:Changelog ↗ 2....

    2026-05-22
    AI日报 AI资讯 人工智能
  • AI日报 · 2026-05-21

    模型发布/更新 1. Qwen3.7系列模型发布:主打Agent能力,多模态交互升级 >...

    2026-05-21
    AI日报 AI资讯 人工智能
  • AI日报 · 2026-05-20

    模型发布/更新 1. 谷歌I/O 2026:Gemini进入自主代理时代 > 谷歌在I/O 2026大会宣布Gemini进入自主代理时代,其新功能可自动执行复杂任务,如管理邮件、安排日程,显著提升工作效率。Google Blog:AI(RSS) ↗ 2. 谷歌发布多模态生成模型Gemini...

    2026-05-20
    AI日报 AI资讯 人工智能
  • AI日报 · 2026-05-19

    模型发布/更新 1. 阿里云推出HappyHorse视频生成模型 > 阿里云发布视频生成模型HappyHorse,支持从文本提示生成1080p多镜头电影级画面,并已在Model Studio上线,目前有限时8折优惠。X:阿里云 / Alibaba Cloud (@alibaba_cloud) ↗...

    2026-05-19
    AI日报 AI资讯 人工智能
  • AI日报 · 2026-05-18

    产品发布/更新 1. Grok Imagine图像生成功能正式发布 > Grok Imagine 现已正式发布 所有人都可使用 基于我们最新的文本到图像模型 能够生成逼真、高质量的图像 支持多种宽高比 现在可在 X 上使用。X:Elon Musk ↗ 2....

    2026-05-19
    AI日报 AI资讯 人工智能
  • AI日报 · 2026-05-17

    模型发布/更新 1. 社区协作再创佳绩,vLLM支持万亿级模型 > 又一次Day0协作,又一次社区胜利。感谢@vllm_project团队始终可靠的支持~。X:蚂蚁百灵 ↗ 2. SANA-WM:一个用于生成1分钟720p视频的26亿级开源世界模型 >...

    2026-05-17
    AI日报 AI资讯 人工智能
  • AI日报 · 2026-05-16

    模型发布/更新 1. MiniMax M2.7模型上线OrcaRouter平台 > M2.7已在 OrcaRouter 平台上线,可通过单一 OpenAI 兼容 API 访问。 X:MiniMax ↗ 2....

    2026-05-16
    AI日报 AI资讯 人工智能
  • AI日报 · 2026-05-15

    模型发布/更新 1. SenseNova U1 技术报告发布,基于 MoE 架构开源模型权重 > 由联合创始人兼首席科学家李沐博士领导的团队发布了 SenseNova U1 技术报告,详细阐述其架构、训练方案与创新突破。此次开源同步发布了基于混合专家模型(MoE)的新权重,旨在推动 AI...

    2026-05-15
    AI日报 AI资讯 人工智能
  • AI日报 · 2026-05-14

    模型发布/更新 1. Hy3预览版登陆GMI,开源最强模型领跑 > Hy3 预览版现已登陆 @gmi_cloud。 X:腾讯混元 ↗ 2. Krea 2发布访问码,限量体验 > Krea 2 访问码发放,每个码可使用50次。这是Krea首个从零构建的基础模型,专注美学多样性和风格控制。...

    2026-05-14
    AI日报 AI资讯 人工智能
  • 打通云端 Hermes 与本地电脑:Tailscale + SSH 全攻略

    让 AI Agent 真正"动手"操作你的电脑 --- 云端部署的 Hermes Agent 只能给建议,碰不到你电脑上的文件。本文介绍如何用 Tailscale + SSH 打通云端和本地,让 AI 真正帮你干活。全程约 30 分钟,包含 Tailscale 组网、Windows SSH...

    2026-05-13
    Hermes Tailscale SSH 教程
  • AI日报 · 2026-05-13

    模型发布/更新 1. Claude Opus 4.7快速模式开放研究预览 > Claude Opus 4.7的快速模式现已在API和Claude Code中开放研究预览。 X:ClaudeDevs ↗ 2. Step Image Edit 2图像模型发布,性能领先且高效 > Step Image...

    2026-05-13
    AI日报 AI资讯 人工智能
  • 你的 API 账单,有多少是重复计算?——大模型缓存命中实战

    同一个 system prompt 被反复发送 1000 次,每次都完整计算。这背后的浪费值得算一算。 大模型推理有一个你可能没注意到的优化:命中缓存。简单说,如果你的 prompt 前缀跟之前某次请求一样,模型不用重新算,直接复用上次的结果。 什么是命中缓存 大模型推理时,prompt 中每个...

    2026-05-12
    LLM 缓存 API优化 成本优化 Prompt Caching
  • 让 LLM 老老实实调工具,光靠提示词不够

    「算法狗」最近发了篇文章,聊怎么让 LLM 老老实实调工具。标题挺有意思:阿里 P8 问候选人这个问题,候选人答「提示词写清楚就行」,面试官笑了。 问题的起点是一个查天气的例子。系统提示写了「city 必须是标准城市名,date...

    2026-05-12
    LLM 工具调用 Agent JSON Schema 提示词工程
  • Agent 路由优化:别再一刀切用大模型了

    Agent 每次都调最贵的模型,但大部分请求根本用不着。这个问题我自己搭 agent 的时候也踩过——不同业务场景的简单任务比例差异很大,客服类可能 90% 是简单任务,代码生成可能反过来,不能照搬别人的比例。 「卡码大模型」最近发了篇文章拆这个,给了组挺直观的数据:用户说「你好」,GPT-5.5...

    2026-05-12
    Agent 成本优化 路由 大模型
  • GPT-Image-2 生图提示词怎么写?拆一套结构化框架

    GPT-Image-2 生图提示词怎么写?拆一套结构化框架 刷到 @Berryxia.AI 发的一套 GPT-Image-2 提示词模板,读完觉得思路挺清晰,就顺手拆了一下。 问题出在哪 大多数人给 GPT-Image-2 的指令长这样: > 帮我画一张科技感的海报,要有AI元素 AI...

    2026-05-12
    GPT-Image-2 提示词工程 AI生图 结构化提示词
  • AI日报 · 2026-05-12

    模型发布/更新 1. SenseNova U1图像生成模型登陆ComfyUI平台 > 商汤SenseNova U1现已可在ComfyUI上运行,支持8步快速推理,应用场景涵盖人像、超现实艺术、文字标志等,相关资源已在Hugging Face、GitHub和Discord开放。X:商汤...

    2026-05-12
    AI日报 AI资讯 人工智能
  • AI日报 · 2026-05-11

    模型发布/更新 1. OpenCode x Ring 2.6 1T 限时免费开放 > OpenCode x Ring 2.6 1T 模型限时免费开放,支持 256K 上下文,具备推理能力,为纯文本模型。感谢 AntLingAGI 和 novita_labs 提供模型支持。X:opencode...

    2026-05-11
    AI日报 AI资讯 人工智能
  • AI日报 · 2026-05-10

    模型发布/更新 1. ERNIE 5.1 发布,预训练成本仅需对标模型 6% > 百度发布 ERNIE 5.1,基于 ERNIE 5.0 预训练基础升级了搜索、推理、知识问答、创意写作和智能体能力,预训练成本仅需对标模型的约 6%。X:百度 Baidu ↗ 2. HappyHorse...

    2026-05-10
    AI日报 AI资讯 人工智能
  • Hermes Agent 命令列表

    Hermes Agent 命令列表 Hermes Agent 是 Nous Research 开源的 AI Agent 框架,支持终端、消息平台和 IDE 运行。本文整理了常用的 CLI 命令和会话内斜杠命令。 CLI 命令 基础操作 | 命令 | 说明 | |------|------| | |...

    2026-05-06
    hermes ai-agent cli commands reference
  • Hermes + Chrome + OpenCode:我用 AI Agent 修 bug 的工作流

    Hermes + Chrome + OpenCode:我用 AI Agent 修 bug 的工作流 最近在维护一个 Web 项目时,摸索出了一套用 AI Agent 定位问题、修复代码、复核验证的工作流。踩了不少坑,但也确实解决了不少用传统方式很难定位的问题。记录一下这套流程,顺便对比一下跟纯用...

    2026-05-06
    ai workflow opencode hermes development
  • 一个让我研究效率翻倍的深度研究Prompt:横纵分析法拆解

    最近看到 @数字生命卡兹克 分享了一个他用了两年的深度研究 Prompt,号称半小时能搞懂任何陌生领域。我仔细读完后,觉得这套方法论确实有东西——不是那种"万能模板"式的心灵鸡汤,而是一套真正可操作的研究框架。 > 原文出处:分享一个我用了2年的深度研究Prompt,半小时帮你搞懂任何陌生领域...

    2026-05-05
    Prompt Engineering 深度研究 方法论 AI工具
  • 6 款 AI 模型 iOS 开发能力深度评测:谁能帮你写出可靠的 Swift 6 代码?

    6 款 AI 模型 iOS 开发能力深度评测:谁能帮你写出可靠的 Swift 6 代码? > 数据来源:@solidus > 评测日期:2026-04-30 > 被测模型:Claude Opus 4.7 max / Claude Sonnet 4.6 high / DeepSeek V4 /...

    2026-05-04
  • 二手交易防骗指南

    六年前我写过一篇二手防骗文,那时候骗子的套路还比较直接——低价诱惑加脱离平台,两招打天下。现在闲鱼月活已经超过两亿,骗子这套东西也升级了好几轮,“看芝麻信用”“不要脱离平台”已经是最低门槛,真正让人吃亏的,是那些看起来完全正常的交易流程。...

    2026-04-29
    闲鱼 二手交易 防骗
  • 别卷了,上科技!用AI助力你拿下offer

    来源:小黑盒 · 作者:裘卓明 Lv.17 --- 作者的核心思路是把AI辅助求职做成一个系统化流程,类似玩游戏做任务:查wiki(拆解JD)→ 调整装备(优化简历)→ 模拟训练(面试对练)→ 收集情报(公司背调)→ 结算抽卡(薪资沟通)。 第一步:拆解岗位要求...

    2026-04-29
    求职 AI 面试 简历
  • 文档驱动的 API 接口同步:CSQAQ Market Lookup 技术解析

    1 引言 接入第三方 API 时,最麻烦的往往不是写调用代码,而是搞清楚"有哪些接口、路径是什么、参数怎么传"。传统做法是维护一份静态文档,但文档和实际接口之间容易脱节——接口改了路径、换了参数名,文档没同步,调用就废了。 docs.csqaq.com 提供了 39 个 API...

    2026-04-22
    Python API 工具 OpenAPI
  • 上下文门控器:纯规则方法实现多轮对话上下文选择

    1 引言 大语言模型在多轮对话中面临两个核心问题: 上下文污染:随着对话进行,历史内容容易混入当前回答。例如前 50 轮讨论 Redis,第 51 轮突然问 Git,模型的回答仍可能受到 Redis 上下文的影响。 上下文膨胀:对话一长,token 快速增长,context window...

    2026-04-22
    LLM Python 上下文管理 检索
  • OpenClaw 命令列表

    | 类型 | 主命令 | 参数 / 别名 | 说明 | |---|---|---|---| | 文本 + 原生(启用时) | | — | 显示帮助;也是 inline shortcut | | 文本 + 原生(启用时) | | — | 列出命令;也是 inline shortcut | | 文本...

    2026-03-21
  • 【数据结构】算法效率的度量

    在计算机科学中,我们需要比较不同算法的效率。 衡量算法效率通常从 时间复杂度 和 空间复杂度 两个方面进行。 一、时间复杂度 时间复杂度表示: > 算法执行时间随问题规模 n 增长的变化趋势。 常见的时间复杂度: | 复杂度 | 示例 | | ---------- | ---- | | O(1)...

    2026-03-04
    数据结构 算法 时间复杂度 考研408
    数据结构
  • OpenClaw 节省 90% Token 的完整优化指南:从输入、调用到模型策略

    很多人刚开始用 OpenClaw 的时候,都会遇到一个问题:Token 消耗得特别快。明明只是聊了几轮,账单就蹭蹭往上涨。 为什么会这样呢? 其实,要理解 Token 消耗,我们可以用一个简单的公式来理解: > Token消耗 = (输入 + 输出) × 调用次数 × 模型价格...

    2026-03-01
    OpenClaw
  • 【故障复盘】Docker 容器挖矿木马排查记录 (Dify)

    问题标签: 问题描述: Linux 服务器 CPU 占用率长期维持在 100% 以上,存在无法彻底杀死的异常进程。 --- 一、 异常现象 (Symptoms) 1. CPU 报警: 命令显示 CPU 使用率极高(如 700%+)。 2. 顽固进程: 发现名为 、...

    2026-01-16
    运维 安全 Docker Dify 挖矿木马

© 2026 ephron.ren · Blog

鄂ICP备2025143575号-2 | 鄂公网安备42080402000391号