• 设为首页
  • 点击收藏
  • 手机版
    手机扫一扫访问
    迪恩网络手机版
  • 关注官方公众号
    微信扫一扫关注
    公众号

老外看《三国》之人物关系网络分析

原作者: [db:作者] 来自: [db:来源] 收藏 邀请

本文翻译自:https://towardsdatascience.com/the-network-of-three-kingdoms-df6f8f8a1263

最近,我开始看中文电视连续剧三国演义。这部电视剧对西方观众来说并不陌生,但我绝对会推荐给喜欢历史剧的任何人。我保证即使有时表演似乎有点夸大,但这个系列绝不会让你失望。

当我第一次听说《三国演义》时,是在《权力的游戏》结束后寻找要观看的新系列的时候。有几篇文章将两者进行了比较,称《三国演义》为《中国权力的游戏》。尽管从艺术的角度对两者进行比较不在本文的讨论范围之内,但可以肯定的是,这两个故事具有很多共同点。两者都有错综复杂的情节、充满了阴谋诡计、出色的军事战略和英勇的行动。此外,二者都有大量的角色,英雄和反派们在几个子剧情中互相影响,最终都与主剧情相连接。

看这部连续剧的时候,我对其同名小说也产生了浓厚兴趣。三国演义是一部14th世纪的小说,作者是中国作家罗贯中。与莎士比亚作品对英国文学的影响一样,三国演义是中国最具影响力的文学作品之一。这事一部鸿篇巨制,内容很长,英文译本更是超过1500页。

在追剧和啃小说的过程中,我想起了令人惊艳的权力游戏的社交网络分析,作者:安德鲁·贝弗里奇(Andrew Beveridge)和揭山(Jie Shan)。受到他们分析的启发,我想分析《三国演义》的社交网络。小说中出现了成千上万的人物,而我想找到谁才是真正的主角。该小说的英文翻译是公开的,可以下载进行文本分析。

分析

我的分析目标是确定小说人物之间的所有互动关系。使用这些关系,可以创建一个由人物角色组成的社交网络,该社交网络可以用图来表示。此外,我可以使用此图来计算中心度指标,这将有助于我推断谁才是主要角色。

互动关系

为了识别角色的互动关系,首先,我们需要定义什么才算是互动。在这里,我计算了两个角色之间的相互作用,即两个角色的名字出现在小说中,彼此之间的间隔不超过15个单词,这是我们从文本中排除了常见的英语单词之后得出的。实际上,我将数字15(单词距离)视为一个变量,并尝试了多个值。最后得出的结论:距离15的分析结果最好。

角色

既然已经定义了交互,就可以确定彼此交互的角色。但是需要分析哪些角色呢?囊括小说的所有1000多个角色是一种选择,但是我觉得,与较小的网络相比,如此大的网络将变得不可读,并且提供的有用信息更少。因此,我确定了小说中100个最受关注的角色。另外,我列出了在小说网站和文章中出现次数最多的角色列表。同时,我创建了我最喜欢的角色的列表。我组合了三个列表,并手动选择得到了最终列表中的角色,该列表由70个角色组成。

文章切分

正如我已经提到的,这部小说的篇幅很大。有些人物可能只在小说的开头很重要,而另一些人物可能只有在小说的中间甚至最后几章之后才变得重要。为了更好地了解角色的演变,我们应该分节研究这部小说。这样,读者可以更好地跟随角色并观察故事中角色的演变。本文将这本小说的120章分为4个部分,并为每个部分创建一个社交网络。每个部分由30章组成。

社交网络

文本分析是在Python中完成的。代码将每个部分的文本作为输入,并生成一个图形对象作为输出。然后使用了开放图工具Gephi为网络创建漂亮的可视化效果。

在每个网络中,人物角色构成网络的节点。每个角色都跟与之互动的角色联系在一起。每个节点的大小表示该角色与其他角色的连接数量,数量越多节点越大。连接的粗细则表示两个字符之间的交互次数,线条越粗则交互次数越多。

此外,该算法还可以识出别角色之间的组团关系。图中团体的正式定义不在本文讨论范围之内。在这里一个比较直观的概念是:团体内成员之间的互动非常强烈,但与团体外其他成员之间的互动并不那么强烈。网络节点的颜色表示角色所属的团体,相同颜色表示属于同一团体。

需要注意的是,团体中的成员不必是小说中的盟友或朋友。有时候,角色与敌人的互动可能要比盟友更多。

中心度

最后,代码计算中心度相关的几个指标,这有助于根据角色的交互关系来量化角色的重要性。

  • 普通中心度(Degree centrality),计算每个角色具有的连接数。这是计算角色重要性的最简单方法
  • 桥接中心度(Betweenness centrality),显示一个角色对连接网络中未直接相连的其他角色有多少帮助。它计算的是在连接其他两个角色的最短路径中找到某个角色的次数。
  • 特征向量中心度(Eigenvector centrality),通过角色与其他重要角色的互动次数来衡量角色的重要性。与少量主要角色的大量交互相比与大量次要角色的交互,权重更高。

这三个中心度都是分数越高,表示人物角色的重要性越高。我们将同时使用三个中心度来考察角色的重要性,但并非所有中心度都具有相同的权重,特征向量中心度更能决定角色的重要性。

接下来,针对小说的每个部分,我们介绍对应的社交网络和中心度指标分析。

《三国演义》第1-30章

小说内容提要(用谷歌翻译直译老外的提要,感受下画风^_^):

第1-30章从桃园的三兄弟刘备,关羽和张飞的誓言开始。董卓夺取了首都的控制权,并与袁绍组成了领导者的军阀联盟。最终,卢布将军因与未婚的貂蝉发生争执而杀死了董卓。皇帝落入曹操之手,曹操将其首都迁至该省。另一个军阀袁Yuan宣布自己为皇帝,但很快就被击败。最终,在刘备的帮助下,卢布被曹操击败。之后他被迅速处决。
后来,刘备加入袁绍。曹操与刘备作战,三兄弟在战斗后分居。关羽不知道自己的兄弟发生了什么事,因此相信他会加入曹操。关羽一得知刘备的下落,便离开了曹操。最终,三兄弟重聚,赵子龙加入了。袁绍决定进攻曹操,但他的无能使他输掉了战斗并失去了庞大的军队。
 

第1-30章的社交网络

这里的团体检测由算法实现,没有手动干预,从上图可以看到,该算法为小说的前30章确定了5个团体。如上文所述,该算法仅基于网络角色的交互来识别团体。

在第一个团体(以紫色显示)中,曹操与他的顾问和将军们在一起。显然,曹操是拥有连接最多,互动最多的角色。其他角色,他们要么想与他结盟以分享权力,要么就让他失望以争取自己的权力。

故事的主人公刘备与他的两个结拜兄弟关羽和​​张飞在一起,并与他的顾问一起组成了第二个团体(以橙色显示)。我们还看到,赵子龙(将稍后加入这三个兄弟)目前与他的首任主公公公孙瓒有关。

在第一章中,另一个英雄吕布扮演着至关重要的角色。吕布与故事这一部分的大多数主要人物都有强烈的互动。他们与董卓一起组成了涉及貂蝉争端的团体(以蓝色显示)。袁术也被安排这个团体中,主要是因为他与吕布的密切互动。

袁绍和其他小军阀组成了第四团体(以绿色显示)。这是一个与董卓及其盟友对抗的结盟团体。不过,袁绍是这一部分中最强大的军阀之一,在社交网络图中可以清楚地看到这一点。

最后一个团体(以深绿色显示)是孙家父子组织。在故事的这一节点上,“孙策”和“孙权”都是重要角色,但在团体之外缺乏重要联系。我们将在后续章节中看到这情况发生变化。

第1-30章的人物角色中心度

接下来,我们看一下人物角色的中心度。不出所料,曹操在三个中心度上都名列榜首。而且,他的桥接中心度非常高,这表明他是将故事的各个部分联系在一起的重要角色。每个团体的军阀可能与其他团体的成员互动不多,但他们都有一个共同的敌人(或盟友),即曹操。

刘备是第二位更具影响力的人物,在三个中心度上都得分很高。尽管他在这些章节中几乎没有领地,但他的特征向量中心度表明他与所有主要角色都有很强的联系。

吕布也一样,从普通中心度来看,他甚至比刘备拥有更多的联系。但他的桥接中心度要低得多,从而降低了他的整体得分。

袁绍排名第四,与关羽相当,关羽的联系较少,但联系更为紧密。当然,袁绍在这些章节之后很快就死了,而关羽在故事的后半部分将变得更有影响力。

孙权在这里也应该被提及。他的普通中心度和本征向量中心度甚至没有进入前10名,但他在桥接中心度上排名第三。这意味着他的团体是通过他与其他团体建立联系形成的。这里孙权已经显示出潜力,后续可以发展成重要角色。

总之,在第1至30章中,曹操排在第一位,其次是刘备,吕布排在第三位,袁绍排在第四位。

第31-60章

小说内容提要(用谷歌翻译直译老外的提要,感受下画风^_^):

在第31-60章中,袁绍对自己的失败感到and丧,并在不久后去世。曹操完全征服了北方,他的力量大大增强。刘备招募了伟大的学者诸葛亮,他将成为下一章的关键人物之一。在另一子图上,孙权在其兄弟孙策去世后继承了南部地区。刘彪去世,他的省向曹操投降。
诸葛亮启程前往南部,说服孙权与曹操作战,组建了孙刘联盟。的确,孙权被说服并做好战斗准备,任命周瑜为统帅。开始在红崖战斗的准备工作,而诸葛亮和周瑜在设计针对敌人的聪明军事战术时试图超越对方。曹操在红崖失败。关羽虽然下令杀死曹操,但让他通过并逃脱。
曹操失败后,刘备终于可以建立领土,三个王国的真实时代开始了。曹操将周瑜反抗刘备。周瑜被击败并因伤身亡。在另一个子图中,张璐在河岸地区与刘章对抗。

第31-60章的社交网络

该算法为第31-60章确定了3个团体。它们大致对应于三个相互对抗的派系。北部的曹操,南部的孙权和西部的刘备。

曹操仍然是联系最多的角色,他的团体(以紫色显示)包含最多的角色,其中大多数角色是他的将军和顾问。

刘备的团体(以橙色显示)由更少但更具影响力的角色组成。其中最重要的几个是他的结义兄弟关羽和​​张飞,以及将军赵子龙。此外,荆州刘表也被纳入该组。刘表去世前与刘备非常亲密,且正计划将他的底盘分给他。他们之间有很多互动,因此算法将他们安排在同一个团体中。

第三个团体是南部地区(以绿色显示)。尽管孙权是南地的主人,但他并不是该团体中最重要的人物。这个最重要的人物头衔属于周瑜或诸葛亮。在这里我们应该注意,诸葛亮在刘备麾下工作,但是在这些章节中,他的大部分时间都花在了南部地区,计划在赤壁作战。因此,他被算法放在了南方团体。另外,顾问鲁肃在团体中也起着重要作用。

第31–60章的人物角色中心度

从前两个中心度来看,曹操仍处于顶部。而且曹操的桥接中心度领先第二名两倍以上。这意味着不同团体中的角色通过曹操连接在一起,可见他仍然是其敌人和盟友的主要利益所在。另一方面,他的特征向量中心度得分不是最好的。原因是与曹操对抗的主要角色之间相互作用很多,形成了一个正反馈回路,从而增强了其他角色的特征向量中心性度。

刘备再次获得第二名。不过这一次,他离曹操更近了,他甚至在特征向量中心度方面获得了第一名。

其他重要角色中最引人注目的是诸葛亮。尽管在前30章中几乎没有提到他,但他在特征向量中心度上排名第二,并且在其他两个中心度上都有很好的位置。诸葛亮是一位杰出的人物,所有主要人物都跟他相关。在接下来的章节中,他将获得更高的排名。

另一个著名人物是周瑜,他的得分与诸葛亮相似。他与许多角色都有联系,并且在三个中心度上都得分很高。不幸的是,像吕布一样,他在这些章节的结尾领了盒饭。

总之,曹操仍然是第一名,刘备是第二名,诸葛亮和周瑜争夺第三名。

第61–90章

小说内容提要(用谷歌翻译直译老外的提要,感受下画风^_^):

在第61-90章的开头,刘备尽管勉强,却对刘章发起了竞选。他赢得了这场战斗,将河岸地区控制在自己的控制之下。曹操,刘备和孙权这三个领主现在都拥有重要的领土。战斗在这三者之间开始。首先,当孙权试图入侵魏国时,孙权与曹操进行了斗争,但很快取得了和平。后来,刘备与自称为魏王的曹操发动战争。刘备为曹操赢得了一些胜利,其中之一是汉中司令部。
关羽拒绝了与南国的婚姻联盟,这使孙权代替曹操加入了曹操。在繁城之战中,关羽被孙权俘虏并处决。关羽去世后不久,曹操也去世了,儿子曹as接任皇帝。张飞被他的下属暗杀,然后下叛了孙权。为了报仇他失去的兄弟,刘备竞选孙权。孙权向曹Pi皇帝屈服,希望对刘备有所帮助。刘备继续竞选,但被悲痛蒙蔽,被击败。他的健康状况恶化,死了。刘备去世后,诸葛亮与the部落发生了冲突,在那里他取得了胜利。

第61-90章的社交网络

该算法在第61-90章中识别出4个团体。三个主要派系几乎保持不变。第一个团体是魏国(以紫色显示),以曹操为首领。曹操仍然是大多数联系和互动的主要角色。这里的离群角色是关羽。关羽显然是对刘备效忠的,但该算法使他成为了曹操团体的一员。这是因为,在这些章节中,关羽一直在与曹操作斗争。因此,他的大部分互动都是与曹操的团体互动,而不是与他的派系互动。

第二个团体是刘备领导的蜀国(以橙色显示)。显然,刘备是该团体的主要人物,诸葛亮是其中另一个重要人物。同样,黄忠将军在团体中也起着至关重要的作用,主要是因为他对汉中战役的重大贡献。

孙权为首的吴国形成了第三个团体(以绿色显示)。除孙权外,吕蒙将军和顾问鲁肃是该团体最重要的人物。

最后,关羽之子关兴和张飞之子张苞组成一个团体(以蓝色显示)。这些角色遵循其自己的子图,彼此之间互动很多,但与其他角色互动不多,因此将它们放置在单独的团体中。在这里,我们还应该注意曹操派系中一个名叫司马懿的小角色的出现,他将成为小说最后部分的主要人物。

第61–90章的人物角色中心度

曹操仍然是无可争议的赢家,尽管在本节的最后几章中他也领了盒饭,但这一部分他在三个中心度都排名第一。而且与其他所有人相比,他的桥接中心度仍然遥遥领先。

在这部分中很难确定第二名。关羽在普通中心度和桥接中心度方面得分很高。不幸的是,他的特征向量中心性度很低。另一方面,刘备有着强大的人脉,这使他在特征向量中心性上得分很高,但他的桥接中心度却很低。另外,孙权在这三个中心度的得分始终都很高,但他的竞争对手之一总是比他高。

另外,我们注意到,诸葛亮在这一部分的得分要低于上一部分。不过这将在小说的最后一部分中发生重大变化。

总之,曹操仍然是最重要的角色,而刘备,孙权和关羽则在争夺第二名。

第91–120章

小说内容提要(用谷歌翻译直译老外的提要,感受下画风^_^):

在最近的30章中,诸葛亮领导了几次反对魏的运动,在那里他与才华横溢的司马a进行了对抗。在第一个战役开始时,诸葛亮会见他的门徒姜伟,后者将在最后几章中扮演重要角色。在竞选期间,诸葛亮和司马Yi都表现出了敏锐的思想,能够赢得决定性的胜利。由于他们都是极好的战略家,因此蜀国与魏国之间的战争仍处于僵局。此外,在这些运动中,赵子龙,张宝和关星也死亡。
诸葛亮因无法击败司马Yi而感到沮丧。他的健康状况恶化了,他去世了,所有的知识都留给了姜伟。姜伟继续对魏发动攻势。在魏方面,曹Rui皇帝去世,最后司马Yi找到了申领国家的机会,这一权利传给了他儿子的司马史和司马昭。在南国,孙权去世,其儿子孙良继任。
建伟仍在领导反对魏的运动,但另一位伟大的将军邓爱(Deng Ai)能够阻止他。最终,司马昭反击,蜀国屈服于魏国,结束了汉朝的统治。北部和河岸地区现已合并,司马昭的儿子司马Yan建立了晋朝。终于,数年后,晋军入侵吴国并击败了其最后一个皇帝孙浩。晋朝征服了王国的所有王国,结束了三个王国的时代。

第91–120章的社交网络

该网络在本节中看起来有所不同。除诸葛亮外,所有之前的主要角色都死掉了。以前的老团体已被新的团体取代。该算法识别出网络中的6个团体,但是只有两个主要团体。此外,这些团体的形成方式更多地与事件的时间顺序有关,而不是人物的忠诚度。

第一个团体(以紫色显示)是诸葛亮与司马懿的斗争,发生在本节的前半部分。尽管他们是敌人,但两个人物都属于同一个团体,双方都是各自阵营的领袖。

第二个团体(以绿色显示)是在这些章节的后半部分发生的姜维和司马昭之间的斗争。同样,参加这些斗争的双方将军也被划分到了他们的团体。

孙权也有自己的团体(橙色显示)。在本部分中,南方吴国的作用不那么重要,因此孙权的团体比以前的部分要小得多。另外,张昭和陆逊将军与孙权处于同一团体。

此外,网络中还有另外三个小团体。像前30章一样,关兴和张苞形成两个人的团体(以深绿色显示)。在这些章节中,关羽和曹操被提及得足够多,可以出现在网络中,但是由于联系有限,它们形成了自己的孤立团体。 “关羽”与“吕蒙”(红色)同组,“曹操”与“曹丕”和“夏侯渊”同组(蓝色)。

第91–120章的人物角色中心度

诸葛亮是最后几章中最重要的人物。他在所有三个中心度中均排名第一。

司马懿和姜维争夺第二名,他们都是本部分的重量级人物,不过司马懿整体得分更高,因为他的普通中心度和桥接中心度要比姜维好得多,而其本征向量中心度也非常接近姜维。

魏延、邓艾和其他人远低于前三者。这表明,与其他部分不同,最后一部分中只有三个主要角色,其余为次要角色。三个王国的伟大英雄时代已然落幕。

结论

全文的社交网络

在我们分析《三国演义》的四个部分时,我们看到了人物的兴衰更替。我们会看到某一部分的英雄几乎没有出现在其他部分中,并且在较早的部分中交互作用最小的角色在随后的部分中成为最有影响力的角色。这是小说的主题之一。野心引导人们寻求权力,但过多的权力会使人们蒙蔽并导致其堕落。

此外,随着剧情的变化,社交网络中的团体不断变化。在大多数情况下,角色会与他们的主公归为一体,但有时由于战斗中的许多互动,他们也会与敌人归为一体。结尾和开头对比来看,团体将看起来完全不同,因为旧的领主和英雄被新的领主和英雄所取代。这是小说的另一个主题。

全文的人物中心度

最大的问题仍然存在,谁是小说中最有影响力的人物?从全文的中心度的社交网络来看,很明显是曹操。曹操是我在小说中遇到的最聪明,最狡猾,最骗人的枭雄之一。纵观他在小说中的演变,很明显他是最有影响力的人物。

刘备位居第二,但他拥有最重要的联系,这一点从他的特征向量中心度可以明显看出。仁慈的主人不像小人那样强大,但是他有强大的朋友。

诸葛亮排名第三,尽管他的联系和重要互动较少,但他的桥接中心度居第二。这意味着小说中的许多人物都是通过他联系在一起的。此外,他将小说的前四分之三的重要人物与小说的后四分之一的重要人物联系起来,例如司马懿和姜维。

关羽位居第四。他是小说中最伟大的武士英雄。尽管他的桥接中心度很低,但正如从他的特征向量中心度所能看到的那样,他具有强大的交互联系。

孙权只能排在第五。这也反映了王国对人物的重要性,最重要的是曹操领导的魏和刘备领导的蜀,而孙权领导的吴则相对次要。

其他的伟大英雄,如吕布、张飞和赵子龙,则被排序在后续位置。特别需要指出的是,曹操的将领和顾问们都没有进入前十位。

这反映了这部史诗小说的另一个主题,枭雄虽然厉害,但是没有伟大的盟友;另一方面,几个正派角色的共同努力最终能克制反派的力量。


鲜花

握手

雷人

路过

鸡蛋
专题导读
上一篇:
sklearn例程:无监督学习可视化股票市场结构发布时间:2022-05-14
下一篇:
sklearn例程:SVD计算维基百科主要特征向量发布时间:2022-05-14
热门推荐
阅读排行榜

扫描微信二维码

查看手机版网站

随时了解更新最新资讯

139-2527-9053

在线客服(服务时间 9:00~18:00)

在线QQ客服
地址:深圳市南山区西丽大学城创智工业园
电邮:jeky_zhao#qq.com
移动电话:139-2527-9053

Powered by 互联科技 X3.4© 2001-2213 极客世界.|Sitemap