录一段语音，AI 帮我变成三个平台的文章

昨天把一个流程完整跑通了。

只要我把每天录音的音频文件放进 Claude Code，它就能按照预设的流程自动处理——先用 Whisper 把语音转成文字稿，然后交给 Claude Code 来做总结和整理。Claude Code 本身就是一个大脑，不需要额外接入其他模型的 API，它直接完成内容的梳理和加工。

整理完之后，它会调用我之前在 Claude 桌面版和手机版上做好的 Skills，把内容输出为适合微信公众号、X 和小红书三个平台发布的文章。

01 它具体帮我做了什么？

我们平时说话难免眉头没尾——一个想法还没说完就跳到另一个话题了。AI 会把这些散乱的内容整理通顺，理清逻辑，再做一个好的包装。同时，它还会对文章里一些你不太确定的内容进行核实。

这套 Skills 我发布在了自己的个人网站上，全部开源。

之前我可能需要好几个平台配合来处理：用 Notebook LM 做初步整理，然后手动在各个平台之间复制粘贴。

现在直接一个入口搞定。我目前用的是 Claude Code，但其实如果你接入别的模型，也可以把整个流程串起来。

这套流程里还用到了宝玉的 Skills，可以根据文章内容自动插入配图。不过有个需要调整的地方——宝玉的 Skills 本身会对文章做排版，但我的 Skills 里已经有排版逻辑了。所以我需要把宝玉的功能限定在”文字转图片”这一步就好，不需要它再做排版。

昨天试了一下，宝玉的排版效果暂时没有我这套 Skills 的排版好看，所以还是以我的排版为主。

我现在也在琢磨文章里配图的节奏问题。文章可能还是需要配图的——比如每隔两三百字，读者就希望看到一张图，做一个视觉切换。就像杂志的排版一样，图文交错，阅读体验会好很多。这部分我还在摸索。

排版完成之后，通过公众号的 App ID 和 App Secret，就能直接把文章推送到公众号的草稿箱里，等我点发送就行。昨天测试了一下，确实可用。包括 X 的长文草稿也是类似的流程。

搭这套工作流其实花了不少时间。一开始想一步到位，后来发现不太现实。于是换了个策略：每一步先用最好的工具各个击破，之后再想办法用全流程自动化串起来。

现在基本跑通了，但还需要调优，比如配图逻辑、是否需要配图、配图频率这些细节。

昨天有朋友建议，既然我平时就是用录音来做输入，这些录音本身也可以作为一个音频素材——变成播客，或者放到公众号、播客平台上。

这个想法我挺认同的。录音本身就是真实的表达，转成文字加工成文章比较容易，但如果录音本身也能作为内容发布，那就是一个素材两种用法。

不过音频发布有个挑战：我说话时难免有重复、废话、“然后""啊”这种口头禅，要怎么处理才能让人听着通顺？这个可能需要我自己有意识地改善表达习惯——少用语气词，想停顿的时候就暂停录音，这样 AI 剪辑起来也容易。

我觉得可以试试看。真实感本身就是一种价值，很多人也喜欢听音频内容。

视频这块我也考虑过。一种方式是用 DJI Neo 这种小型无人机在前面跟拍——一边走一边说，无人机自动跟随拍摄。不过需要提前报备，而且它有 360 度避障，你往前走它往后退，比我现在用的 DJI Flip 方便，Flip 只有大约 180 度的避障范围，往后退的时候可能会撞到东西。

另一种方式是坐在一个地方聊，做口播视频，放到更多平台上。

我觉得公众号是一个最没有压力的创作空间——不需要出镜，想说什么就说什么，后期加工也容易。就像前面说的，一段录音就能变成一篇可以发布的文章，最后只需要定稿一下。

如果你也有分享的想法，可以从最简单的方式开始：

先写日记——不用公开，自己先记录。写一段时间之后，你可能会发现有些内容希望得到别人的反馈和互动，那时候再找一个合适的平台发布。

然后你可能会对音频感兴趣——因为音频能传递更多信息，比如语气、情绪。再后来，你可能愿意露脸做视频，传递更丰富的内容。当然，视频需要更多准备，比如拍摄工具、场景选择，这些都可以慢慢来。

最近在 X 上看到很多优质内容。X 的算法确实能把好文章推出来，而且现在发帖达到一定流量还能获得收益。希望微信公众号以后也能有类似的创作者激励机制。

好了，今天就聊到这里。散半的第一天，各自加油，明天见。

分享是一件可以渐进式开始的事情。