录一段语音,AI 帮我变成三个平台的文章
昨天把一个流程完整跑通了。
只要我把每天录音的音频文件放进 Claude Code,它就能按照预设的流程自动处理——先用 Whisper 把语音转成文字稿,然后交给 Claude Code 来做总结和整理。Claude Code 本身就是一个大脑,不需要额外接入其他模型的 API,它直接完成内容的梳理和加工。
整理完之后,它会调用我之前在 Claude 桌面版和手机版上做好的 Skills,把内容输出为适合微信公众号、X 和小红书三个平台发布的文章。
01 它具体帮我做了什么?
我们平时说话难免眉头没尾——一个想法还没说完就跳到另一个话题了。AI 会把这些散乱的内容整理通顺,理清逻辑,再做一个好的包装。同时,它还会对文章里一些你不太确定的内容进行核实。
这套 Skills 我发布在了自己的个人网站上,全部开源。
02 以前有多麻烦?
之前我可能需要好几个平台配合来处理:用 Notebook LM 做初步整理,然后手动在各个平台之间复制粘贴。
现在直接一个入口搞定。我目前用的是 Claude Code,但其实如果你接入别的模型,也可以把整个流程串起来。
03 排版和配图
这套流程里还用到了宝玉的 Skills,可以根据文章内容自动插入配图。不过有个需要调整的地方——宝玉的 Skills 本身会对文章做排版,但我的 Skills 里已经有排版逻辑了。所以我需要把宝玉的功能限定在”文字转图片”这一步就好,不需要它再做排版。
昨天试了一下,宝玉的排版效果暂时没有我这套 Skills 的排版好看,所以还是以我的排版为主。
04 配图的节奏
我现在也在琢磨文章里配图的节奏问题。文章可能还是需要配图的——比如每隔两三百字,读者就希望看到一张图,做一个视觉切换。就像杂志的排版一样,图文交错,阅读体验会好很多。这部分我还在摸索。
05 一键推送到公众号
排版完成之后,通过公众号的 App ID 和 App Secret,就能直接把文章推送到公众号的草稿箱里,等我点发送就行。昨天测试了一下,确实可用。包括 X 的长文草稿也是类似的流程。
06 搭建过程中的一些心得
搭这套工作流其实花了不少时间。一开始想一步到位,后来发现不太现实。于是换了个策略:每一步先用最好的工具各个击破,之后再想办法用全流程自动化串起来。
现在基本跑通了,但还需要调优,比如配图逻辑、是否需要配图、配图频率这些细节。
07 录音还能怎么用?
昨天有朋友建议,既然我平时就是用录音来做输入,这些录音本身也可以作为一个音频素材——变成播客,或者放到公众号、播客平台上。
这个想法我挺认同的。录音本身就是真实的表达,转成文字加工成文章比较容易,但如果录音本身也能作为内容发布,那就是一个素材两种用法。
不过音频发布有个挑战:我说话时难免有重复、废话、“然后""啊”这种口头禅,要怎么处理才能让人听着通顺?这个可能需要我自己有意识地改善表达习惯——少用语气词,想停顿的时候就暂停录音,这样 AI 剪辑起来也容易。
我觉得可以试试看。真实感本身就是一种价值,很多人也喜欢听音频内容。
08 视频内容的探索
视频这块我也考虑过。一种方式是用 DJI Neo 这种小型无人机在前面跟拍——一边走一边说,无人机自动跟随拍摄。不过需要提前报备,而且它有 360 度避障,你往前走它往后退,比我现在用的 DJI Flip 方便,Flip 只有大约 180 度的避障范围,往后退的时候可能会撞到东西。
另一种方式是坐在一个地方聊,做口播视频,放到更多平台上。
09 从文字开始,慢慢延伸
我觉得公众号是一个最没有压力的创作空间——不需要出镜,想说什么就说什么,后期加工也容易。就像前面说的,一段录音就能变成一篇可以发布的文章,最后只需要定稿一下。
如果你也有分享的想法,可以从最简单的方式开始:
先写日记——不用公开,自己先记录。写一段时间之后,你可能会发现有些内容希望得到别人的反馈和互动,那时候再找一个合适的平台发布。
然后你可能会对音频感兴趣——因为音频能传递更多信息,比如语气、情绪。再后来,你可能愿意露脸做视频,传递更丰富的内容。当然,视频需要更多准备,比如拍摄工具、场景选择,这些都可以慢慢来。
10 X 平台的观察
最近在 X 上看到很多优质内容。X 的算法确实能把好文章推出来,而且现在发帖达到一定流量还能获得收益。希望微信公众号以后也能有类似的创作者激励机制。
好了,今天就聊到这里。散半的第一天,各自加油,明天见。
分享是一件可以渐进式开始的事情。