当 AI 成为中枢,我的工具链终于跑通了

薛衡 · 2026.04.12

昨天跟不同的朋友和家人聊了很多,聊完之后最深的感受是:跟不同的人交流,真的能打开思路。你会发现很多自己用着用着就忽略掉的东西,别人一句话就点醒了。

01 Skill 要专注做一件事

朋友给我演示了他做的一个 Skill——把 Claude 的 Wiki 做成知识库,用 Obsidian 作为数据库,再用 Claude Code 作为 AI 中枢来检索和生成内容。他的工作流和我之前的做法很像,但有一个关键区别:他把它封装成了一个独立的 Skill。

我试了一下,效果确实不错。选了他几篇文章,很快就录入到知识库里了。

这让我重新思考了一个问题:一个 Skill 的边界到底应该划在哪里?

之前有人说过,一个 Skill 应该专门做一件事情。我现在越来越认同这个观点。比如”录入知识库”是一个 Skill,“从知识库生成文章”是另一个 Skill。它们各自独立,但可以互相配合——你可以先调用录入 Skill 把内容存进去,再调用生成 Skill 从知识库里提取素材、拼出一篇文章。

把太多功能塞进一个 Skill 里,反而会让它们之间的协作变得困难。

02 从知识库直接生成文章

昨天我们还聊到一个更有意思的用法:能不能直接给知识库一个选题,让它自动生成一篇文章?

试了一下,效果出乎意料地好。只要把知识库的地址告诉那个 Skill,再给一个选题方向,它就能从知识库里抽取相关的内容,自动拼成一篇完整的文章。

我之前也有一个文章优化的 Skill,可以把内容适配成微信公众号、X、小红书等不同平台的格式。现在这两个 Skill 串起来,流程就变成了:**语音录入 → 知识库 → 选题生成 → 多平台发布。**整条链路都打通了。

03 万事皆可触达的感觉

说到流水线,我最近把好几个工具串了起来:Claude Code、Telegram、GitHub、还有我的个人网站。

昨天我在 Telegram 上直接跟 AI 说:“帮我改一下网站的风格,先不要动代码,给我三个预览方案。“它直接就在聊天里给了我三个样式让我选——虽然最后没有一个完全达到预期,但这个交互本身已经很顺畅了

**随时随地想到什么,就可以去做什么。**入口是一个即时通讯工具,中枢是 AI,AI 通过 MCP 或者 CLI 去操作 GitHub、邮件系统、各种已有的服务。这种感觉就像之前一直想象的那种未来:你只需要有一个 AI,它就能触达你所有的功能,帮你完成所有的事情。

04 Hermes:意外的顺手

这两天还在研究 Hermes。一个让我意外的发现是:**它沟通起来比 OpenClaw 顺畅很多。**我给它的指令,它基本都能很好地完成。

目前我在 Aider 和 Claude Code 之间是这样分工的:主力任务用 Claude Code,因为更稳;Hermes 那边我配的是 Codex 加上本地的 Gemma 和千问模型,组合起来效果也不错。

现在我让 Hermes 在做的事情,是重新实现微信群聊总结的功能。

05 告别截图 OCR,拥抱本地数据库

微信群聊总结这个功能,之前走了一段弯路。

最初的方案是截图加 OCR:让电脑自动截取微信窗口的画面,通过文字识别把聊天内容提取出来。问题是——截图功能依赖显示器。我的显示器是公用的,不可能一直开着。后来我买了 HDMI 欺骗器插上去,想让电脑以为有显示器在,但截图功能还是不稳定,经常出问题。

截图加 OCR 这个方案,实在太脆弱了。

所以我现在准备换一个思路:用 Workflow 的方式,直接去读微信本地的聊天记录数据库。每天跑一个定时任务,只抓取新增的内容做增量处理。这样不需要截屏,也不依赖显示器,稳定性会好很多。

拿到聊天记录之后,再用 AI 模型做总结,然后发布到微信群里。发布这一步之前已经跑通了——它不需要截图,只需要定位到输入框、粘贴内容、发送就行了。

从截图到数据库,方法变了,但目标没变:让这条自动化链路真正能稳定跑起来。

— END —

感谢阅读,如果觉得有启发

欢迎关注「薛衡 Henry」

← 返回文章列表