AI 长任务:从一次提示词到一个会执行的目标

薛衡 · 2026.05.16

过去我习惯让 AI 回答问题,现在我开始尝试把一个更大的目标交给它。区别不只是任务变长,而是人和 AI 的分工正在变。

AI 长任务封面图

从周末早上的目标感说起

周末早上,我先玩了一会儿宝可梦相关的游戏。它让我想到一件事:自由度和目标感其实是两套系统。

一个游戏如果只有自由度,玩家很容易散掉;如果只有单一目标,又会很快疲劳。好玩的地方在于,它让你一边自由探索,一边不断感到“我还可以往前走一步”。

我最近看 AI 工具,也有类似感受。它们正在从“回答一个问题”,慢慢变成“完成一个目标”。

长任务不是多聊几轮

昨天我主要试的是目标式长任务。我的理解很朴素:你不只是给 AI 一个问题,而是给它一个更大的目标,让它围绕这个目标持续探索、测试、回顾、反馈,然后继续往下推进。

目标进入长任务迷宫

今天早上我看到一个朋友说,他的某个任务已经跑了 90 个小时。我很好奇最后会出来什么。

如果一个任务真的能跑这么久,里面大概率不是单次生成,而是很多轮循环:尝试、失败、回退、调整、再尝试。

这也是长任务的核心:它不是把聊天变长,而是让 AI 进入一个更接近“执行项目”的状态。

我试了两个想法

第一个想法,是让 AI 帮我做一本有交互性的“思考之书”:收集世界上最好的思考,把它们整理成一本可以互动的网站,读者可以像对话一样跟这本书交流。

结果有两面。框架和部署很快出来了,甚至可以直接通过 Cloudflare 生成一个网站链接,发给朋友看。但内容深度不够,书的章节、结构和思想密度都还不够。

这提醒我:只给一个大方向,AI 很擅长先搭壳;但如果想要内容厚度,就要给它更多材料、更明确的判断标准。

第二个想法,是“上帝之眼”:用 3D 地球展示每天全球发生的重要事件,再分析事件之间的关联和 insight(洞察)。

这个 demo(演示原型)看起来更有意思,但也暴露出一个现实边界:界面可以很快搭出来,数据可以接新闻 API,但真正的分析能力还是要接模型 API。

网站可以免费,智能还不能

个人开发者今天已经很幸福了。静态网站、页面部署、基础流量,很多时候都可以用很低成本完成。像 Cloudflare 这样的服务,在一定范围内几乎可以免费部署。

但智能不是这样。

智能作为按量资源

如果一个项目不接模型 API,它当然也能运行,只是很多逻辑都要写死:去哪抓数据、怎么判断事件相关性、怎么生成总结、怎么给用户解释,都要提前规定好。

如果你希望软件真的有分析能力,能根据新情况生成新判断,那就绕不开模型 API。智能现在仍然是按量计费的资源,不像静态页面那样接近零边际成本。

这里还有一个容易混淆的点:你订阅 ChatGPT、Codex 或其他工具,可以用它们来开发项目,但不能把订阅能力直接嵌入自己的产品。产品运行时要用智能,还是要走 API,API 就是另外付费。

个人开发者的三条路

现在做 AI 项目,我看到大概三条路。

第一条路,把逻辑写死。适合早期 demo,先验证界面、交互和需求,不急着接智能。

第二条路,做成 BYOK(自带密钥)模式。开发者把框架搭好,用户自己填 API key(密钥),成本和调用量由用户自己承担。很多开源 AI 项目都是这样。

第三条路,自己承担模型成本,再通过订阅制或按量计费收费。这更像正式产品,但也意味着你必须认真算账。

对个人开发者来说,前期最务实的方式可能是:先用写死逻辑验证体验,再找便宜或有免费额度的 API 做小规模智能能力,等价值明确后再考虑收费模型。

我会继续用长任务

我现在挺推荐大家试试这种方式:不要只问 AI 一个问题,而是把一个你一直想做的东西交给它,让它去完成一个目标。

但前提是,你要把目标说清楚。

如果还不清楚,就先跟 AI 多聊几轮,让它帮你把目标、功能范围、实现方式、验收标准整理出来。然后再把这份整理好的提示词交给长任务。

目标越大,输入越具体,结果越可能接近你想要的东西。

真正重要的是产品化

很多 AI 进展刚出来时,大家未必马上能理解它的意义。过一两周,等它进入普通人的真实场景,人们才会发现它到底好不好用。

Agent(智能体)也是这样。刚开始大家会对“自主执行”抱有很高期待,觉得它什么都能干。实际用下来会发现,它需要沟通、纠偏、补材料,也会犯错。

但这不代表它没价值。真正留下来的,是那些被产品化得足够好的形态:模型、API、MCP、浏览器、文件系统、本地环境、远程聊天入口,被组合成一个普通人能用的工作流。

当你可以在熟悉的聊天窗口里下达目标,而执行发生在本地电脑环境里,AI 就不再只是一个回答框。它开始接近一个能被交办任务的协作者。

我会继续试这种长任务模式。也建议你找一个一直想做但没动手的想法,不要让 AI 只回答,而是让它真的去做。

给它一个足够大的目标,也给它足够具体的输入。

AI 长任务全文总结信息图

— END —

感谢阅读,如果觉得有启发

欢迎关注「薛衡 Henry」

← 返回文章列表