Karpathy:建议大模型改用HTML输出,AI交互终局为「交互式神经视频」

火星财经快讯

05月12日 14:37
据 动察 Beating 监测,「vibe coding」概念提出者、OpenAI 创始成员 Andrej Karpathy 今天发文力挺 Claude Code 团队提倡的「用 HTML 取代 Markdown」做法。他不仅强烈赞同这一改变,还勾勒出了 AI 交互界面的演进路线图,预测大模型在经历多轮形态迭代后,输出的终极形态将是「交互式神经视频」。 Karpathy 认为,AI 输出格式的演变从最早极难阅读的纯文本,进化到如今的 Markdown,再到正逐渐成为新标准、具有极高排版灵活性的 HTML。未来还将经历多代中间形态(4、5、6 等),最终抵达终局(n):由扩散模型直接生成的交互式神经视频。对于这一形态的具体模样,他直接点名了前 OpenAI 研究员近期发布的无代码像素级渲染原型 Flipbook。 这一演进趋势的底层逻辑在于人脑的物理带宽。Karpathy 指出,人类大脑有约三分之一是专用于处理视觉信号的并行处理器,这是向人脑输入信息的「十车道高速公路」。这就决定了人机融合交互的最优解:人类向 AI 传达指令(Input)的最佳方式是极具沟通效率的语音,而 AI 向人类反馈结果(Output)的最佳方式则是高带宽的视觉画面(图像、动画或视频)。 此外,他指出当前的输入端仍存在明显痛点,目前只靠语音或文本依然不够,急需补齐类似两人并排看电脑时「指着屏幕特定区域比划」的空间指示能力。作为现阶段提升体验的捷径,他强烈建议用户直接在提示词末尾加上「将回复结构化为 HTML」。

查看原文 >
本内容旨在传递行业动态,不构成投资建议或承诺。
看更多快讯,下载火星财经 APP