>>主流路径:神经符号计算的强强联合
目前,新符号主义最主流、最成熟的实现路径是神经符号计算(Neuro-Symbolic AI)。其核心策略是让神经网络和符号系统这对AI界的“老冤家”握手言和,进行明确的劳动分工,实现1+1>2的强强联合。
神经网络(联结主义)的角色:感知层。它被安排在最前端,负责处理它最擅长的工作——从原始、模糊、高维度的数据中进行感知和模式识别。它就像是AI敏锐的“眼睛”和“直觉”。
感知和识别:从一张复杂的图片中识别出人、上衣、球等具体物体。
学习表示:将识别出的抽象概念(如物体的“蓝色”或“圆形”)转换成数学上易于处理的向量表示(Embedding),为后续处理做好准备。
符号系统(符号主义)的角色:推理层。一旦神经网络完成了感知任务,并将结果“符号化”——即转换成离散、明确的符号事实,接力棒就交给了符号系统。它就像是AI冷静、理性的“逻辑大脑”。
逻辑推理:基于符号化的事实,进行严谨的、可解释的、一步步的逻辑推导。
知识表达:使用知识图谱等结构化工具来高效地存储和查询精确的事实。
因果推断:尝试回答关于“为什么”的问题,而不仅仅是“是什么”。
让我们通过一个绝佳的例子来具体感受这个流程。假设AI接到一个任务:看一张图片,并回答“图中穿蓝色上衣的人左边有多少个球?”
神经网络(感知):首先,一个强大的视觉模型会扫描图片,像人类一样识别出其中所有的关键物体 [人A, 上衣A, 球A, 球B, 人B, 上衣B...],并提取它们的属性 [颜色(上衣A)=蓝色, 颜色(上衣B)=红色...] 以及它们之间的空间关系 [球A 在 人A 的左边...]。
转换成符号:接下来,系统内部的一个模块会将这些从像素中提取出的模糊概念,转换成一个精确的、机器可读的符号事实库。这个过程就像是把视觉感知翻译成逻辑语言,例如:{is_a(obj1, person), has_clothing(obj1, obj2), is_a(obj2, shirt), color(obj2, blue), is_left_of(obj3, obj1), is_a(obj3, ball), ...}。
符号系统(推理):最后,符号推理引擎在这个刚刚构建好的、结构化的知识库上,执行一条精确的逻辑查询。这就像在数据库中进行查询一样,例如用类似SQL的语言进行查询:COUNT(ball) WHERE is_left_of(ball, person) AND person.clothing.color = 'blue'。推理引擎会准确无误地遍历事实,返回最终的数量。
在这个优雅的流程中,神经网络处理了它擅长的模糊、连续的图像世界,而符号系统处理了它擅长的精确、离散的逻辑世界。整个过程不仅结果准确,而且每一步都清晰可见、可被审查,从根本上解决了黑箱问题,极大地提升了系统的可靠性和可信度。