AI 长任务：从一次提示词到一个会执行的目标

过去我习惯让 AI 回答问题，现在我开始尝试把一个更大的目标交给它。区别不只是任务变长，而是人和 AI 的分工正在变。

从周末早上的目标感说起

周末早上，我先玩了一会儿宝可梦相关的游戏。它让我想到一件事：自由度和目标感其实是两套系统。

一个游戏如果只有自由度，玩家很容易散掉；如果只有单一目标，又会很快疲劳。好玩的地方在于，它让你一边自由探索，一边不断感到“我还可以往前走一步”。

我最近看 AI 工具，也有类似感受。它们正在从“回答一个问题”，慢慢变成“完成一个目标”。

昨天我主要试的是目标式长任务。我的理解很朴素：你不只是给 AI 一个问题，而是给它一个更大的目标，让它围绕这个目标持续探索、测试、回顾、反馈，然后继续往下推进。

目标进入长任务迷宫

今天早上我看到一个朋友说，他的某个任务已经跑了 90 个小时。我很好奇最后会出来什么。

如果一个任务真的能跑这么久，里面大概率不是单次生成，而是很多轮循环：尝试、失败、回退、调整、再尝试。

这也是长任务的核心：它不是把聊天变长，而是让 AI 进入一个更接近“执行项目”的状态。

第一个想法，是让 AI 帮我做一本有交互性的“思考之书”：收集世界上最好的思考，把它们整理成一本可以互动的网站，读者可以像对话一样跟这本书交流。

结果有两面。框架和部署很快出来了，甚至可以直接通过 Cloudflare 生成一个网站链接，发给朋友看。但内容深度不够，书的章节、结构和思想密度都还不够。

这提醒我：只给一个大方向，AI 很擅长先搭壳；但如果想要内容厚度，就要给它更多材料、更明确的判断标准。

第二个想法，是“上帝之眼”：用 3D 地球展示每天全球发生的重要事件，再分析事件之间的关联和 insight（洞察）。

这个 demo（演示原型）看起来更有意思，但也暴露出一个现实边界：界面可以很快搭出来，数据可以接新闻 API，但真正的分析能力还是要接模型 API。

个人开发者今天已经很幸福了。静态网站、页面部署、基础流量，很多时候都可以用很低成本完成。像 Cloudflare 这样的服务，在一定范围内几乎可以免费部署。

但智能不是这样。

智能作为按量资源

如果一个项目不接模型 API，它当然也能运行，只是很多逻辑都要写死：去哪抓数据、怎么判断事件相关性、怎么生成总结、怎么给用户解释，都要提前规定好。

如果你希望软件真的有分析能力，能根据新情况生成新判断，那就绕不开模型 API。智能现在仍然是按量计费的资源，不像静态页面那样接近零边际成本。

这里还有一个容易混淆的点：你订阅 ChatGPT、Codex 或其他工具，可以用它们来开发项目，但不能把订阅能力直接嵌入自己的产品。产品运行时要用智能，还是要走 API，API 就是另外付费。

现在做 AI 项目，我看到大概三条路。

第一条路，把逻辑写死。适合早期 demo，先验证界面、交互和需求，不急着接智能。

第二条路，做成 BYOK（自带密钥）模式。开发者把框架搭好，用户自己填 API key（密钥），成本和调用量由用户自己承担。很多开源 AI 项目都是这样。

第三条路，自己承担模型成本，再通过订阅制或按量计费收费。这更像正式产品，但也意味着你必须认真算账。

对个人开发者来说，前期最务实的方式可能是：先用写死逻辑验证体验，再找便宜或有免费额度的 API 做小规模智能能力，等价值明确后再考虑收费模型。

我现在挺推荐大家试试这种方式：不要只问 AI 一个问题，而是把一个你一直想做的东西交给它，让它去完成一个目标。

但前提是，你要把目标说清楚。

如果还不清楚，就先跟 AI 多聊几轮，让它帮你把目标、功能范围、实现方式、验收标准整理出来。然后再把这份整理好的提示词交给长任务。

目标越大，输入越具体，结果越可能接近你想要的东西。

很多 AI 进展刚出来时，大家未必马上能理解它的意义。过一两周，等它进入普通人的真实场景，人们才会发现它到底好不好用。

Agent（智能体）也是这样。刚开始大家会对“自主执行”抱有很高期待，觉得它什么都能干。实际用下来会发现，它需要沟通、纠偏、补材料，也会犯错。

但这不代表它没价值。真正留下来的，是那些被产品化得足够好的形态：模型、API、MCP、浏览器、文件系统、本地环境、远程聊天入口，被组合成一个普通人能用的工作流。

当你可以在熟悉的聊天窗口里下达目标，而执行发生在本地电脑环境里，AI 就不再只是一个回答框。它开始接近一个能被交办任务的协作者。

我会继续试这种长任务模式。也建议你找一个一直想做但没动手的想法，不要让 AI 只回答，而是让它真的去做。

给它一个足够大的目标，也给它足够具体的输入。

AI 长任务全文总结信息图

— END —

感谢阅读，如果觉得有启发

欢迎关注「薛衡 Henry」