当 Codex 进入手机,AI 工作流少了一道门

薛衡 · 2026.05.15

今天早上看到 Codex 打通移动端和桌面端,我第一反应是:这块拼图终于补上了。

昨天我还在和朋友聊,GPT 的 Codex 什么时候能把移动端补齐。结果今天就看到了。试了一下,手机端输入内容,桌面端同步接收,本机继续跑任务,整体效果基本达到预期。

这件事的意义不只是“手机也能用”。它真正改变的是,开发和内容生产的入口不再被固定在某一台电脑上。

对话框,才是新的工作台

现在很多工作,本质上已经不是“打开某个软件”,而是“持续和 AI 对话”。IDE、文件树、terminal、debug 面板当然重要,但它们越来越像辅助设施。真正决定工作是否能继续推进的,是那个承载上下文的对话框。

只要这个对话框能同步,session 能延续,context 不丢,你就可以在手机上想清楚一段需求,在桌面端让它继续执行;也可以在路上给某个 project 开一个新 session,等回到电脑前再接着处理。

工作台不再是一块屏幕,而是一条连续的对话线。

移动端与桌面端之间延续的 AI 对话工作台

移动端打通后,自动化少了一个断点

我这段时间一直在搭一套内容自动化流程:音频输入、原始稿整理、多平台文章生成、排版、生图、发布前处理。

过去最大的断点之一是生图。

Claude 可以帮我写文章、优化结构、生成提示词,但它不能直接把正式图片做出来。于是流程中间就会出现一次跳转:把 prompt 复制到 Midjourney,等图出来,再下载,再放回文章目录。

这一步不是不能做,但它会破坏自动化的连续性。

Codex 如果能直接调用 GPT Image,并且图片质量接近我对 Midjourney 的要求,那么这条流程就会顺很多。不是因为我想让 AI 替我决定内容,而是因为我想把重复的搬运、排版、插图命名、平台适配这些环节尽量交给系统。

我的目标不是 100% 自动发布。输入和主内容仍然由我来,审稿也必须由我来。真正要自动化的是流程:把音频或文字原始稿交进去,它能生成公众号、X、小红书、网站版本,配好图,排好版,停在审核口。

这就是我说的 95% 流程自动化。

从原始稿到多平台内容的自动化流水线

工具能力,最后还是会碰到权限边界

Codex 在我自己的 Mac 上跑得很顺,在另一台 Windows 电脑上也还可以。但公司电脑就麻烦很多。

公司电脑没有管理员权限,CLI 安装经常会遇到问题。现在比较现实的方式,是通过 IDE extension 来用。它能解决一部分问题,但和完整 CLI 工作流相比,还是少了一些自由度。

不过这也提醒我,工具体验不能脱离使用场景。

个人电脑里,Codex 的权限可以放开,适合跑更完整的本地任务。公司电脑里,有组织安全策略,很多权限不可能完全打开。这种情况下,Codex 的价值可能主要体现在 vibe coding,也就是在 IDE 里帮你理解、修改、推进代码,而不是接管整个环境。

所以我现在的判断是:如果权限有限,IDE 里的 AI 和 CLI 里的 AI 差距会被缩小;如果权限足够,CLI 的多任务和自动化能力才会真正拉开差距。

我开始更在意“环境可恢复”

今天早上还顺手研究了一下 tmux。

我想解决的问题很简单:电脑重启之后,之前的工作环境怎么快速恢复?最好是一个指令下去,窗口、session、正在进行的上下文都能尽量回到原来的状态。

Mac 不需要经常重启,但系统更新、内存压力、机器卡顿的时候,总会有这个需求。尤其是现在同时跑很多 AI session、浏览器窗口、开发环境之后,16G 内存已经开始显得吃紧。

移动端同步、桌面端执行、tmux 环境恢复,表面看是三件事,其实都指向同一个问题:

我的工作不应该被某一次关机、某一个终端、某一个窗口打断。

Persona 是下一层可迁移资产

除了 Codex,我最近还在继续想 Persona。

昨天和朋友聊了很久。他做过不少 Persona,也在经过允许的情况下,用一些朋友的对话记录、邮件和历史材料提取过 Persona。提取之后,它像一个可以加载的人格层:把它放到 agent 上,agent 就能更接近那个人的表达方式、判断偏好和思考路径。

这个方向的用途很广。

比如一位导师要辅导学生。如果导师把自己的邮件、答疑记录、课程反馈和思考方式整理成 Persona,学生就可以先和这个 Persona 聊。很多基础问题、方向性问题、表达上的压力,都可以先在这个分身那里解决。

这并不是替代导师,而是把导师的经验前置出来。导师节省时间,学生也更敢问、更能问细。

医疗场景也类似。医生的经验、问诊习惯、判断路径,可以形成一个虚拟医生的 Persona,先和病人进行初步交流。医生训练的不只是一个聊天机器人,而是一个带有自己经验结构和沟通方式的人格层。

在我看来,agent 是一个打包概念:模型、工具、记忆、工作流,再加上 Persona。真正有长期价值的,可能不是某一个平台里的智能体,而是这个 Persona 能不能迁移。

如果一个 Persona 能从 Claude 迁移到 Codex,能从一个模型迁移到另一个模型,还能保持相近的表达、偏好和判断方式,那它才算是一个独立资产。

全文结构信息图

结尾

今天 Codex 移动端给我的最大感受,不是“又多了一个功能”,而是 AI 工作流又少了一个断点。

对话框可以跨设备延续,图片可以纳入自动化流程,环境可以被恢复,Persona 也可能成为可迁移资产。它们拼在一起以后,未来的工作形态会越来越像一套随身的协作系统,而不是某个固定软件。

人还是输入者、判断者和审稿人。

AI 更像一个一直在线的合作者。

— END —

感谢阅读,如果觉得有启发

欢迎关注「薛衡 Henry」

← 返回文章列表