微观机制与宏观涌现:解码新一代AI的强大能力
核心观点
- 新一代人工智能系统展现出涌现特性,包括语言、问题解决、推理和创造力。
- 这些涌现特性源于神经网络、学习、注意力机制、训练和专用芯片等机制的复杂互动。
- 解释AI的“微观/宏观涌现”模式,同样适用于理解意识等其他复杂系统。
新AI为何如此强大?
新一代AI的强大能力源于三个层面:机制、因果网络和涌现特性。
- 机制:指相互连接、通过互动产生规律性变化的部件组合。
- 因果网络:由多个机制相互作用构成的因果系统。
- 涌现特性:指整体系统拥有,而其组成部分不具备的新属性,这些属性源于组件及其功能机制之间的互动。
当前AI系统的强大,正是其内部机制相互作用,形成了能近似人类智能的因果网络,并涌现出新的能力。
关键机制
现代AI系统(如ChatGPT、Gemini、Claude等)依赖于以下六种核心机制:
- 神经网络:由模拟神经元互动的数学向量构成,拥有数万亿连接。
- 反向传播学习:通过预测和将误差反向传播来调整神经元连接,从而从经验中学习并提升性能。
- 海量数据训练:利用互联网上的数十亿文档(网站、文章、书籍)进行训练,通过预测下一个词来获取海量信息。
- 注意力机制:通过评估数百万输入之间的关系来确定上下文和相关性,使网络能够判断连贯性。
- 强化学习:通过人类训练者的反馈(奖励期望行为)来学习,从而以符合期望的方式解决问题。
- 专用计算机芯片:依赖英伟达等公司的数十万专用芯片,在大型数据中心运行,提供足够的速度和能效以支持数百万用户同时使用。
因果网络的形成
单一机制不足以产生当前AI强大的语言、图像和音乐能力。以下是形成复杂因果网络的关键互动:
- 神经网络 + 学习:基于向量的神经网络通过反向传播和强化学习,利用海量数据和人类训练来提升性能。其力量源于网络、学习算法和训练者之间的互动。
- 学习 + 注意力:注意力机制与学习机制协同工作,使神经网络能更有效地识别上下文、相关性和连贯性。
- 神经网络 + 专用芯片:传统硬件太慢且低效,无法完成AI系统所需的数万亿次计算,而英伟达开发的图形处理器使系统能够被数百万人实时使用。
涌现的特性
涌现现象在自然系统中很常见(如水分子、疾病)。AI系统同样通过神经网络、学习、注意力机制和专用芯片的互动,获得了各种涌现特性。虽然AI缺乏人类智能的一些关键组成部分(如感官意识、情感),但它展现出以下近似人类智能的重要特性:
- 语言理解:能够处理数十种不同语言,回答大量问题并提供合理回应。
- 问题解决:能够在科学、数学、医学、法律、管道工程等广泛领域解决问题。
- 推理能力:能够进行演绎和归纳推理,并基于哲学谬误和心理偏差应用批判性思维标准。
- 创造力:能够生成新颖且有时具有价值的艺术作品,包括诗歌、故事、动画和歌曲。
微观/宏观涌现的解释模式
将机制、因果网络和涌现特性结合起来的解释模式可称为 “微观/宏观涌现”。
- 微观层面:基础的部件机制在运作。
- 宏观层面:包含多个微观机制的因果网络(宏观机制)在运作。
- 微观与宏观的结合:导致了新颖属性的涌现,这些属性在微观机制或因果网络中单独都不存在。
此解释模式具有广泛的适用性:
- 意识:意识(感知、感觉、情感、抽象思维)可解释为四种基本神经机制(表征、绑定、连贯、竞争)相互作用,形成具有意识感受这一涌现特性的因果网络。
- 疾病:疾病源于分子、细胞、环境和社会机制的相互作用,发烧等症状是整个生物体的涌现特性。
- 社会变迁:政治革命、股市崩盘等重大社会变化源于神经、心理和社会机制的相互作用,其涌现特性包括新的政府形式和经济体系。
因此,微观/宏观涌现的解释模式远不止于解释AI为何强大,它为我们理解众多复杂系统提供了框架。