昨晚跟 Claude 语音聊了一小时,聊完我对 AI 的看法变了

Henry Xue · 2026.03.26

薛衡 HENRY 昨晚跟 Claude 语音聊了一小时,聊完我对 AI 的看法变了

薛衡 · 2026年3月25日 清晨随便聊两句。最近天气还是冷,春天不知道什么时候才真正到来。今天想聊的话题是——AI 的语音模式。

01 语音模式,到底是什么体验? 不知道有多少人试过用语音直接跟 AI 聊天。不是打字,是真的用说话的方式,把它当成一个聊天对象。 我之前用得还比较多,最近越来越少了。昨天心血来潮又试了一下,主要跟 Claude 和 ChatGPT 聊。语音模式的特点是需要快速反馈,所以各家一般都用比较小的模型。Claude 用的是 Haiku,它们最小的模型,但反应速度和思考深度都还不错。ChatGPT 那边我问了一下,它说自己用的是 GPT-4o——一个已经下线的模型,虽然在语音模式里还在跑。当然我没办法验证这个信息是不是真的,毕竟这是它自己说的。 语音模式最有意思的地方在于即时反馈。现在的技术已经做得很好了,几乎不需要等待,跟正常对话一样流畅。不管是 ChatGPT 还是 Claude,都能给你一种真的在聊天的感觉。毕竟打字和说话是完全不同的体验——就像跟一个很久没见的朋友面对面聊天,和发微信,感受完全不一样。

02 拿语音模式学东西,居然挺靠谱 昨天我让 Claude 一步一步给我解释什么是大语言模型(LLM),它背后的机制是什么。它从预测模型的本质讲起,一层一层深入,讲得非常清楚。 Claude 跟 ChatGPT 在语音模式下的风格差异挺明显的。ChatGPT 我以前一上来就觉得它更像一个心理咨询师的角色,很会聊天,但不太会往深了走。Claude 不一样,它可以针对技术话题更加深入。昨天它非常耐心地跟我解释了 LLM 的底层逻辑,包括神经网络(Neural Network)的层级结构、强化学习(RL)和监督学习(Supervised Learning)之间的区别和联系,还聊到了 Scaling Law——模型是不是会随着算力和数据的增长变得越来越聪明。它也很诚实,告诉我这个问题在行业里有很大的争议。 让我印象最深的是,它非常坦诚地说:它自己并不真正”懂”这些内容,它本质上就是一个预测模型。它吸收了大量的文本,在其中做概率预测——所谓的”填词游戏”。加上 temperature(随机性参数)的调节,它不会每次给出一样的回答。但归根结底,它不像人一样能真正理解内容。

” 聊完之后,我对 AI 的认知确实又进了一步。当你对 AI 的底层逻辑有更多了解之后,反而会更有方向感——知道它能做什么,边界在哪里。

03 把活儿都交给 AI,我还能学到什么? 最近我一直在思考一个问题:如果很多事情都交给 AI 做,那我自己从中能学到什么? 比如把一个复杂的需求扔给它,它直接给你一个结果。说实话,有时候如果比较忙,可能结果都只是草草看一下,不会很认真地去审。这个做法其实有一个前提——你已经对它的输出套路比较了解了,看一下大致结构和逻辑没问题就行。至于细节,比如它生成了几千行代码,你不可能逐行去看,只能检查大致的架构和逻辑有没有明显问题。 那我们到底从中学了什么?昨天跟 Claude 讨论了这个问题,最终的结论是:AI 可以作为一个导师(Tutor)或者思考的补充者,但你仍然需要一个真实的导师。因为真人导师在行业中有更丰富的经验,了解你没有表达出来的那些背景和上下文,而 AI 至少在目前还无法全面了解你。 同时,AI 输出的内容本身也是很好的学习材料。我最近在尝试用 NotebookLM 来学习,因为它的幻觉(hallucination)是最少的。如果要学一个全新的领域,可以通过它内置的搜索功能去找相关的论文和资料,先做一个知识框架,然后不断深入。

04 Claude 正在变得越来越全能 不得不说,我越来越觉得 Claude 是一个非常全能的助手。它不仅能干活、能实现各种产品需求,还有不错的记忆系统,能够了解你。加上现在的 MCP(Model Context Protocol)Skills、强大的搜索能力,以及底层模型的不断升级,它的能力上限在持续提高。 不过 Claude 的语音模式目前有一个限制——不支持中文。它的文本模式可以处理中文,但语音模式只能用英文交流。反过来想,这倒也是一个练英语的好机会。它的用词比较简单,语速也正常,如果你又想练英文、又想深入一些具体话题,Claude 的语音模式值得一试。 只是最近 Claude 的注册门槛确实越来越高了。如果你有需求但不知道怎么注册和使用,确实会有点麻烦。以前没觉得,但随着 Claude 能力越来越强,这个注册限制也变得越来越明显。

05 关注 AI 行业,要抓第一手信息 昨天我还看到 GitHub Trending 上有一个字节跳动的项目叫 DeerFlow,受到了很大的关注。我觉得 GitHub Trending 是一个很好的信息源——哪些项目最近在涨星、哪些方向比较火,都值得研究一下。你不需要亲自去用每一个项目,把仓库链接扔给 AI,让它帮你做研究和分析就行。 你也可以用类似的自动化工具帮你定时监测这些趋势。再结合一些 AI 领域的论文解读和新闻(比如李自然的内容),去抓更多第一手信息。如果能看英文当然最好,可以第一时间获取信息,不用等别人做翻译和分析。当然,现在有 AI 翻译也不是什么大障碍,只是翻译毕竟是加工,多少会损失一点精确度。

06 写在最后 今天主要聊了 AI 的语音模式,推荐大家去试试。现在很多 AI 都支持语音交互——完全用说话的方式跟它对话,还能切换不同的语调。用的虽然是小模型,但反应特别快,可以跟它更直接地沟通。有些想法只有在聊的时候才会冒出来,这是打字替代不了的。 不知道以后会不会有不同的 AI 一起聊天的模式——比如 ChatGPT、Claude 和我三个人在一个对话里,应该能碰撞出不少有意思的话题。

你试过 AI 的语音模式吗?感受怎么样? 欢迎在留言区聊聊,明天见。

— END — 感谢阅读,如果觉得有启发 欢迎关注「薛衡 Henry」

← 返回文章列表