据 Andrej Karpathy 称,这位 OpenAI 联合创始人以及“vibe coding”概念的创作者,今天他认可了 Claude Code 团队的做法:在大型语言模型的输出中使用 HTML,而不是 Markdown。Karpathy 为 AI 交互界面绘制了演进路线图:从纯文本到 Markdown,再到 HTML,随后经历多种中间形式,最终达到由扩散模型直接生成的交互式神经视频这一最终阶段。

Karpathy 将这种演进归因于人类大脑的带宽。他指出,大约有三分之一的人脑在并行处理视觉信号——这是一条用于信息输入的“十车道高速公路”。他认为,最理想的人机交互应该将用于人类输入的高效语音与来自 AI 的高带宽视觉输出(图像、动画或视频)结合起来。他建议用户立刻在提示中加入“以 HTML 形式进行结构化回复”,作为近期期待的改进。