许多人习惯将“Love & Peace”并列为天然成对的美好象征,可对我而言,它们从来没有站在同一边。
那么它们是反义词吗?也不完全是。因为确实存在某种“爱”,能够越过混乱,抵达绝对秩序。它不像理想的爱追求虚假的相互理解,而是一种经得起推理的范式。
还记得解题篇1结尾那句吗?那是我个人非常喜欢的一句。
将“爱”与“和平”列为反义词,本身就带着点叛逆的味道。如今解构盛行,而我恰好对这种充满张力的矛盾想法情有独钟,就像最近写的那篇“圣女”“妓女”二相性的文。
巧的是,最近在课程里也遇到一个有趣的问题。为什么用“词向量”技术去寻找反义词,常常会“翻车”,找到的反而更像是近义词呢?
尽管看起来这本NTR小说和词向量没什么关系(我说Neighborhood Token Representation你二龙吗?),但感兴趣的各位可以看下去,看完……也不好说,确实挺牵强附会的
考虑到大家可能对机器学习不太熟悉,接下来的废话里,我会尽量用自己理解的方式解释清楚相关概念(叠甲:本人学科和写文都属半吊子,概念若有简化或偏差,还请多包涵,主要是为了方便理解)。
首先,词向量是什么?
简单说,就是用一串数字(数学里称为向量)来代表一个词的意义。
为什么要这样处理呢?因为直接的词计算机看不懂,就像光看“笑”或“哭”这两个字,根本无法理解它们的意思(甚至笔画数都一样呢)。
人类可以查词典、关联词义,这个方法也不是不行,也有一个叫“知识图谱”的名词来描述这种做法。但这通常需要人工构建,而且面对当下互联网海量且动态变化的词汇关系(咱自认为也是网络抽象人,但是之前两个月没刷社媒,然后也能多出来一堆无法理解的抽象梗),我们更需要一种能自动学习词义的方法。
那么,计算机怎么学?
最简单的方法是,它会扫描网络上的海量文本,观察哪些词总在相似的句子里出现?共享哪些临近的词?比如“苹果”多与“吃”、“水果”为伍,“po”则常与“jmjp”、“f5”为伍(并非)。
通过这种对于庞大文本资料的观察,计算机构成一张极其复杂的多维“词义地图”,为每个词在想象中描绘出一个由众多数字(维度)决定的“坐标位置”。(地图也不太准确,地图坐标就两维或三维,实际上这种维度很有可能成百上千,所以可以叫词义/特征空间?)
意思相近的词,比如“快乐”和“开心”,因常在相似语境(如“他感到很快乐/开心”)出现,位置就很靠近。这些坐标就是词向量。学习海量文本后,我们就得到了一系列有一定实际用处的词向量。
而后,科学家们发现,这张地图上的词义关系有时能用加减法模拟。经典例子就是:国王 - 男人 + 女人 ≈ 女王。这就像在地图上移动:从“国王”出发,减去“男性”特征,加上“女性”特征,就抵达了“女王”附近。很酷,对吧?
背景介绍完了,我们回到问题。
我最初寻找反义词时,也套用了这个思路:如果“快乐”的反义词是“悲伤”,那么快乐 - 悲伤这个向量差(代表从“快乐”变到“悲伤”的方向和距离),应该和正确 - 错误的向量差类似吧?毕竟都是“积极变消极”。理论上,用“快乐”减去这个“反义方向”,就该得到“悲伤”。
然而,实践效果烂完。 输入“快乐”想找“悲伤”,它可能甩给你“高兴”、“兴奋”、“满足”等一堆近义词。
为什么呢? 我当时的想法是:会不会是因为,反义词常常出现在一模一样的句子里?
比如:“她感到非常 快乐。” vs “她感到非常 悲伤。”。在这两句中,除了核心词互换,其他词完全相同。
回顾下上面的背景知识,词向量技术的基石是“一个词的意思由其上下文决定”。
而反义词实际上和近义词类似,其实都容易共享上下文。它们占据句子相同位置,被同样的动词、名词修饰。或许在计算过程中,计算机会更倾向于将它们视为“同类项”(都是情感形容词),归拢在一起。而它们之间关键的对立关系,在浩瀚的共享上下文信息中,反而被淹没或扭曲了。毕竟,要真正体会其语义含义,可能需要更深层的上下文理解,而简单模型做不到这点。
然后,有趣的是,当我往自己写的简陋程序里输入“Love”后,“Peace”真的作为高排名候选词跳了出来。
看吧,爱(Love)和和平(Peace)果然是对立的。
当然,思考并未止步于此,无论是这个学术问题,还是“Love & Peace”的关系。
回想“女王”那个例子,国王 - 男人 + 女人 ≈ 女王成立的前提,是假设“女王”与“国王”的差异仅在于性别维度。但现实真的如此简单吗?啊,这个不展开了,我们举点别的例子,例如“正确”和“错误”是逻辑维度上反义,“高兴”和“悲伤”是情绪维度上反义,“快”和“慢”是速度维度上的反义。如果想要找到一个能一劳永逸,解释所有的反义关系,那么是否有点过于傲慢了?
总之,词向量空间是高维且复杂的。语义关系(同义、反义、上下位等)并非总能完美对应简单的线性平移。
那么,回到原点:“Love & Peace”是反义词吗?
用简单的“是”或“否”来回答,就像用那个不靠谱的向量减法的程序找反义词一样笨拙。
在普世价值里,爱与和平确有意涵相近之处。然而,在追求表面和谐、回避冲突的语境下,那种要求改变、充满张力的“爱”,与旨在维持现状的“和平”,确实可能背道而驰,形成一种深刻的张力甚至对立。在这个特定维度、这种特定解读下,它们确实散发着“反义”的气息。
说到底,大概是我轻小说看得太多,加上个人对阴间tag的独特偏爱(那我问你,清汤寡水的纯爱怎么有人能看得下去,那我问你?),才让我固执地觉得:爱和和平,说是近义词也不是,反义词倒也不能算。毕竟近义词共享语境,而反义词不也共享着战场吗?