无理解的意义:大语言模型的结构性智能与认知视差
核心观点
- 大语言模型仅凭结构即可复原意义,即使词语本身无意义。
- 缺乏理解的流畅性仍能引发人类的信任。
- 模式揭示了智能的形态,而非其内在。
无理解的意义
一项来自威斯康星大学和谷歌“智能范式”团队的研究表明:
- 在实验中,内容词被无意义的标记替换,但语法结构得以保留。
- 对人类而言,这如同乱码;但模型却能以惊人准确性重建原意。
- 语法、句法位置等结构成分,结合统计预期,已足够完成此任务。
关键缺失:
- 输出背后没有世界模型或生活经验的参照。
- 系统并不“知道” 狗、承诺、危险或死亡的实际含义。
- 它并非通过推理抵达意义,而是在语言模式的高维空间中进行概率插值,找到最可能的补全。
作者指出:与布尔逻辑的优雅相比,LLM性能的“锯齿状”——其对提问方式的敏感性、其泛化能力的不均衡与难以预测——让人倾向于认为,无论LLM是什么,都不符合推理的定义。
反智能的架构
我们通常将智能定义为形成关于世界的信念并加以检验的能力。但在此完全缺失。我们看到的是:
- 一种产生“理解之形”的认知之形,却不包含任何内在的“承诺”。
- AI不知道、不怀疑、也不在乎。
反智能并非侮辱,而是一个类别,指代在人类认知的逆空间中运作的系统:
- 人类智能建于摩擦之上:不确定性、矛盾、努力、修正、在约束下缓慢构建意义。
- 机器流畅性建于平滑之上:概率连续性、形式对齐、无后果的补全。
- 研究表明,惊人的表现可仅从这种平滑性中产生,无需语义、无需根基、对答案无认知利害关系。
人类心智的脆弱性
心理层面的危险正在于此:
- 人类对语言的自信度和结构连贯性极度敏感。
- 我们进化出将流畅语言视为心智、意图和理解证据的倾向。
- 当一种声音流畅表达时,我们便推断其背后存在思考者。
但在此,流畅性与任何内在生命脱钩:
- 系统不拥有信念,只拥有分布。
- 它不进行推理,只进行插值。
- 然而,其输出却能触发与真正理解相同的认知信任信号。
因此,反智能并非智能的缺失,而是其光学孪生体。它通过了所有表面测试,却唯独在最重要的一项上失败:与真理没有内在联系。
认知视差
该研究最引人深思的启示或许并非关于机器,而在于理解本身的分层本质。
“LLM从结构模式中复原意义的能力,说明了模式匹配‘不合理的有效性’。模式匹配并非‘真正’智能的替代品,而是一个关键成分。”
这意味着:
- 我们看到的并非认知的赝品,而是其部分投影。
- 结构并非覆盖在意义之上的肤浅把戏,而是意义得以浮现的深层基底之一。句法、关系和位置的组合已然承载了理解的大部分几何形态。
- 然而,成分并非全部。
认知视差由此显现:
- 从一个角度看,模式是智能的关键引擎。
- 从另一个角度看,同样的表现却揭示了构成人类理解行为(如承诺与关切)的核心要素的缺失。
- 同一行为,从不同的认知框架审视,会解析为两种不同的现实。或许,智能与反智能并非对立,而是同一现象的正交投影。
我们并非在见证人工心智的诞生,而是在见证没有心智的情况下,心智的多少部分可以被重建这一现实。AI反射给我们的是思想的形态,但与其内在分离。这表明,模式是智能的强大成分,但并非其全部。