当 AI 成为中枢，我的工具链终于跑通了

昨天跟不同的朋友和家人聊了很多，聊完之后最深的感受是：跟不同的人交流，真的能打开思路。你会发现很多自己用着用着就忽略掉的东西，别人一句话就点醒了。

01 Skill 要专注做一件事

朋友给我演示了他做的一个 Skill——把 Claude 的 Wiki 做成知识库，用 Obsidian 作为数据库，再用 Claude Code 作为 AI 中枢来检索和生成内容。他的工作流和我之前的做法很像，但有一个关键区别：他把它封装成了一个独立的 Skill。

我试了一下，效果确实不错。选了他几篇文章，很快就录入到知识库里了。

这让我重新思考了一个问题：一个 Skill 的边界到底应该划在哪里？

之前有人说过，一个 Skill 应该专门做一件事情。我现在越来越认同这个观点。比如”录入知识库”是一个 Skill，“从知识库生成文章”是另一个 Skill。它们各自独立，但可以互相配合——你可以先调用录入 Skill 把内容存进去，再调用生成 Skill 从知识库里提取素材、拼出一篇文章。

把太多功能塞进一个 Skill 里，反而会让它们之间的协作变得困难。

昨天我们还聊到一个更有意思的用法：能不能直接给知识库一个选题，让它自动生成一篇文章？

试了一下，效果出乎意料地好。只要把知识库的地址告诉那个 Skill，再给一个选题方向，它就能从知识库里抽取相关的内容，自动拼成一篇完整的文章。

我之前也有一个文章优化的 Skill，可以把内容适配成微信公众号、X、小红书等不同平台的格式。现在这两个 Skill 串起来，流程就变成了：**语音录入 → 知识库 → 选题生成 → 多平台发布。**整条链路都打通了。

说到流水线，我最近把好几个工具串了起来：Claude Code、Telegram、GitHub、还有我的个人网站。

昨天我在 Telegram 上直接跟 AI 说：“帮我改一下网站的风格，先不要动代码，给我三个预览方案。“它直接就在聊天里给了我三个样式让我选——虽然最后没有一个完全达到预期，但这个交互本身已经很顺畅了

**随时随地想到什么，就可以去做什么。**入口是一个即时通讯工具，中枢是 AI，AI 通过 MCP 或者 CLI 去操作 GitHub、邮件系统、各种已有的服务。这种感觉就像之前一直想象的那种未来：你只需要有一个 AI，它就能触达你所有的功能，帮你完成所有的事情。

这两天还在研究 Hermes。一个让我意外的发现是：**它沟通起来比 OpenClaw 顺畅很多。**我给它的指令，它基本都能很好地完成。

目前我在 Aider 和 Claude Code 之间是这样分工的：主力任务用 Claude Code，因为更稳；Hermes 那边我配的是 Codex 加上本地的 Gemma 和千问模型，组合起来效果也不错。

现在我让 Hermes 在做的事情，是重新实现微信群聊总结的功能。

微信群聊总结这个功能，之前走了一段弯路。

最初的方案是截图加 OCR：让电脑自动截取微信窗口的画面，通过文字识别把聊天内容提取出来。问题是——截图功能依赖显示器。我的显示器是公用的，不可能一直开着。后来我买了 HDMI 欺骗器插上去，想让电脑以为有显示器在，但截图功能还是不稳定，经常出问题。

”

截图加 OCR 这个方案，实在太脆弱了。

所以我现在准备换一个思路：用 Workflow 的方式，直接去读微信本地的聊天记录数据库。每天跑一个定时任务，只抓取新增的内容做增量处理。这样不需要截屏，也不依赖显示器，稳定性会好很多。

拿到聊天记录之后，再用 AI 模型做总结，然后发布到微信群里。发布这一步之前已经跑通了——它不需要截图，只需要定位到输入框、粘贴内容、发送就行了。

从截图到数据库，方法变了，但目标没变：让这条自动化链路真正能稳定跑起来。

— END —

感谢阅读，如果觉得有启发

欢迎关注「薛衡 Henry」