本文转载自公众号 京东数科

北美时间2019年5月19日,《权利的游戏》将迎来最终季最后一集,弥漫在维斯特洛大陆上长达8年的硝烟,即将散尽。想必大家都在猜测谁会受到命运的惩罚领盒饭,谁又能活到最后、登上铁王座、笑傲维特斯洛大陆。
国外一个叫Rostlab的团队,已经迫不及待的用机器学习对结局做了预测。网站的名字叫《冰与数据之歌》。没错,他们是利用数据对权游结局做了最强剧透。
如何操作最强剧透?
首先,采集数据!
在马丁的笔下,无论是男女好坏,主角配角,很有可能在前一秒还活蹦乱跳,下一秒就挂掉。马丁的世界里有上千个角色,其中三分之一已经死亡,其他的正在生存……或者毁灭的路上。
截止到第七季结束,剧中主要人物共有186人死亡,致死原因前三位分别为伤病,火灾和投毒。窒息也是常见的死因,小恶魔就是在父亲泰温的床上勒死了背叛自己的雪伊。剧中仅有两人是自然死亡,所以想要正常老死,真的好不容易。

“即使最重要的角色也并非‘老不死’,而且死法千奇百怪,因此预测他们的存活率变得十分有意思,我们还能借此机会对机器学习技术进行测试”。数据科学家大毛博士说。
数据足够多,且足够有趣,数据科学家们热情高涨地投入到了工作中(剧透中)。
本次预测的数据源主要来自于原著、维基、推特、剧迷自建网站等,团队收集了2000个角色第一次出现的时间,是男性还是女性,是贵族还是贫民,有多少头衔,关联的人物,忠于哪个家族,在哪一章中死亡等信息。
其次,建模分析!
接下来,团队将收集到的信息建模,预测谁将继续生存。团队的第一个模型使用了与贝叶斯推理相关的技术来检查不同特征与角色寿命的关系。
该模型的假设如下:每个角色的生命,都会有一些基本概率,对于所有角色而言,这种基本危险是相同的。而某些属性的存在与否是他区别于其他角色死亡率的原因。
例如,作为男性角色会把风险提高60%,而来自兰尼斯特家族可能会降低50%,通过累计变动的危险因素这种方式,团队能够为剧中任何角色建立生存函数。从生存函数里可以看到,在某个时间点,角色是否死亡的可能性是多少。通过生存函数可以看出囧诺有45%的几率活到60岁,詹姆有60%的可能性会在第八季中活下来。
这个模型使用了贝叶斯推理相关的技术,我们引入贝叶斯法则:

公式中的A和B分别代表两个事件。A为你要考察的目标事件(权游里角色是否会存活),B是另一个事件,他是已知的(比如权游里角色的家族(House)、情人数量(Lovers)、婚姻状况(Marriage)、地位(Titles)、主角/配角(Major/Minor character)以及性别(Male)等和角色死亡概率挂钩的几个因素。)。
以龙妈为例:

利好:
龙妈是已婚人士,死亡率下降。
龙妈“乃暴风降生,丹尼丝坦格利安一世,不焚者,弥林女王、安达尔人与先民的女王,草海上的卡丽熙,奴隶解放者,火龙之母”,一看血统就很高贵,死亡率再次下降。
是权游中的主要角色,死亡率再次再次下降。
利空:开挂的龙妈几乎无不利条件。
在众多利好属性如贵族、女性、结过婚、主角的加持下,龙妈的死亡率仅为0.9%,位居生存榜首位。

再以小恶魔为例:
利好:
他结过婚,死亡率下降。
他是西境守护、凯岩城公爵泰温·兰尼斯特的孩子,死亡率再次下降。
他非常喜爱读书,善于思考,富有谋略,被称为七国里最聪明的男人,在君临城危在旦夕之时,挺身而出拯救了国家!死亡率再次再次下降。
他是权游中的主要角色,死亡率再次再次再次下降。
利空:
他是男性,在在维斯特洛世界,男性的死亡率为22%,女性的死亡率为11%。死亡率上升。
综上,小恶魔的综合死亡率为2.5%。

按照以上模型,我们可以推算出其他角色的死亡率如下,最容易领盒饭的是波隆、魔山、三傻。

贝叶斯在生活里的应用
不仅是权游里,生活中涉及到预测的地方都可以使用贝叶斯。比如,你可以通过贝叶斯理论来算出你的爱情。
昨天你的女神coco小姐姐今天对你微笑了一下,春心荡漾的你想知道coco到底喜不喜欢你。
导入贝叶斯公式:
P(B|A) = P(A|B)*P(B) / P(A)
事件A:coco小姐姐喜欢一个人。P(A)代表她喜欢一个人的概率,我们用P(喜欢)来表现。
事件B:coco小姐姐微笑了。P(B)代表她对一个人微笑的概率,我们用P(微笑)来表现。
P(B|A)是如果她喜欢某个人,那么她微笑的概率。我们用P(微笑|喜欢)来表现;P(A|B) 是你想知道的答案,即小姐姐微笑时是否代表她喜欢你,我们用P(喜欢|微笑)来表现。

如果女神见到每个人都微笑,那么我们得到:P(微笑|喜欢) = p(微笑)。就是说,即使知道她对你笑,也不代表对你有感觉。
而另一种极端情况:假设她对每个她喜欢的人都笑,且只对她喜欢的人笑。那么p(喜欢|微笑)= 1,可以肯定:她喜欢你。

参考文献:
[1] Angraal, S., Bhatnagar, A., Verma, S., Shergill, S., Gupta, A., & Khera, R. (2018). Risk Factors Associated with Mortality in Game of Thrones: A Longitudinal Cohort Study. arXiv preprint arXiv:1802.04161.
[2] Lystad, R. P., & Brown, B. T. (2018). “Death is certain, the time is not”: mortality and survival in Game of Thrones. Injury epidemiology, 5(1), 44.