大世界,小世界——浅淡六度分隔理论

到过上海的都知道上海有个大世界,坊间还流传有「不到大世界,枉来大上海」的说法,足可见其影响。我不知道「大世界」这一名称是从何而来,或许和其兼容并蓄的风格有关吧,在老上海,各式各样的娱乐方式都能在大世界中觅其踪迹。「大世界」也算是不枉其名吧。不过今天,要是哪家想要囊括一切称自己是「大世界」恐怕是要被人笑话的,就连我们的地球也都被叫作了「地球村」呢。没错,这个世界正在变得越来越小。近几年一直很热的社会化网络就是这一现象再好不过的体现了。网络的出现使地理距离的影响变得微不足道,Web 2.0的诞生更是凭借其去中心化的方式使我们每个人都成了这一网络中的重要一环。这便被称为「小世界现象」,而六度分隔理论则是其理论上的基础。

既然是小世界,那究竟有多小呢?六度分隔理论告诉我们,世界上任意两个陌生人之间平均只需通过6步(5个中间人)就能联系到一起,这也是「六度分隔理论」这一名称的由来。正像电影《六度分离》中所说的:

I read somewhere that everybody on this planet is separated by only six other people. Six degrees of separation between us and everyone else on this planet. The President of the United States, a gondolier in Venice, just fill in the names.

微软亚洲研究所的人立方关系搜索给了我们一个很好的机会亲自体验一下所谓的六度空间。比如可以试一下陈水扁和李宇春。你会发现这样一条关系线:陈水扁 → 吕秀莲 → 张慧妹 → 刘德华 → 李宇春,神奇吧!再把陈水扁换成布什试试?中间人竟然还少了一个:布什 → 鲍威尔 → 刘翔 → 李宇春

接下来的问题,为何正好是「六度」,而不是「五度」或「七度」呢?这就涉及到图论了,1998年,康奈尔大学的Duncan J. Watts和Steven Strogatz提出了一个「小世界网络」的模型来解释这一问题

右边的是随机图模型,任意两个节点之间的连接都是随机的。而小世界网络模型则不同,它是以一个规则的环形网络为基础,再以一定的概率重新布线而得到的。想想看,这是不是更符合现实世界中的人际关系?

设节点数为$N$(即人口总数),节点的度(即每个人所认识人的数量)平均为$K$,随机概率为$\rho$,同时满足$0 \le \rho \le 1$ 和 $N\gg K \gg \ln(N)\gg 1$,这样便得到了一个无向图。对于一个环形网络(如左图,此时$\rho=0$),它的平均最短路径(即两人之间相隔的步数)为$l(0)=N/2K\gg 1$。不妨假设全球人口60亿、平均每人认识100人,代入后,得到$l(0)=30,000,000$,也就是说此种情况下,要平均经过3000万人才能将素不相识的两个人联系起来。再来看看一个完全随机的网络(如右图,此时$\rho \rightarrow 1$),它的平均最短路径为$l(1)=\frac{\log N}{\log K}$。再把前面的数据代入,有$l(1)=4.89$!当然,上面两种都是极端情况,对于更一般化的小世界网络(如中间那张图)的$0<\rho<1$,随着$\rho$的增加,平均最短路径$l$会非常迅速地从$l(0)$降为$l(1)$。于是,实际情况下$l$更接近6,所以也就称为「六度分隔理论」了。

六度理论还有几个很好玩的版本。一个是好莱坞版的,说的是任何一个影星和凯文·贝肯(Kevin Bacon)之间都能通过其他6个影星相联系。不过,这里的联系和前面不同,指的是两人都曾合作出演过同一部电影。那为什么是凯文·贝肯呢?原因就在于贝肯纵横影坛数十载,出演过大大小小各种不同类型的电影,也就更容易和其他明星联系起来。同时,也就有了个贝肯数(Bacon number)的概念,就是指某影星和贝肯之间连接需要的中间人数量。自然,贝肯自己的贝肯数为0。有个专门的网站The Oracle of Bacon可以查找某影星的贝肯数。以希区柯克为例来看看连接是如何实现的。希区柯克曾在1943年的《Show Business at War》与奥森·威尔斯(Orson Welles)合作过,而威尔斯和杰克·尼科尔森(Jack Nicholson)则在1971年的《A Safe Place》中合作。最后,尼科尔森又和贝肯共同出演了1992年的《义海雄风》,Bingo!于是,希区柯克的贝肯数便是3了。对于上面那个网站收录的110万影星,他们平均的贝肯数只有2.98,即那110万人平均每人只需通过2个中间人就能连到贝肯!还有值得一提的是,虽然这是以贝肯的名字命名的,不过还有比他更厉害的,那就是丹尼斯·霍珀(Dennis Hopper),所有那些影星的「霍珀数」只有2.772,可以算是真正的「好莱坞中心」了。

除了好莱坞版,还有个数学家版的,这人版本的「贝肯」同是多产而古怪的匈牙利数学家保罗·埃尔德什(Paul Erdős)。而好莱坞版中的合演电影在这也变成了合写论文。埃尔德什本人可是曾和551人合作过论文的牛人啊。如果霍珀是「好莱坞中心」的话,那埃尔德什则是「学术界中心了」。来看看一些人的埃尔德什数吧。大卫·希尔伯特的埃尔德什数为4,这是由于如下关系:Paul Erdős → H. N. Shapiro → Kurt O. Friedrichs → Richard Courant → David Hilbert。而且这还不仅于数学领域,下面还有其他各领域大牛们的埃尔德什数(选取部分):

  • 爱因斯坦(诺贝尔物理学奖得主):2
  • 马科维茨(诺贝尔经济学奖得主):2
  • 翁萨格(诺贝尔化学奖得主):3
  • 埃克尔斯(诺贝尔生理学或医学奖得主):3
  • 谢尔盖·布林、拉里·佩奇(Google创始人):3
  • 鲍林(诺贝尔化学奖、和平奖得主):
  • 卡尔纳普(哲学家、逻辑实证主义创始人):4
  • 乔姆斯基(语言学家、生成文法发明人):4
  • 霍金(宇宙学家):4
  • 波普尔(哲学家、证伪理论创始人):4
  • 图灵(计算机科学之父):5
  • ……[1]

比上面的好莱坞版和数学家版更有意思的,是这两者的合体,好莱坞+数学家版的六度理论,对应的就称为「埃尔德什-贝肯数」(Erdős–Bacon number)。计算方法特简单,只要将某人的埃尔德什数和贝肯数相加就行了。当然,有埃尔德什-贝肯数的可都不是一般人,此人必须既写过论文也演过电影才行。猜猜最小的埃尔德什-贝肯数是多少??是3!没想到吧,其拥有者是MIT的数学教授Daniel Kleitman。Kleitman曾和埃尔德什合作过论文,于是他的埃尔德什数为1。同时呢,他还在马特·达蒙演的《心灵捕手》中友情客串过,于是他的贝肯数也只有2。厉害吧!除了Kleitman,还有其他一些学术界和影艺界的牛人也有很小的埃尔德什-贝肯数,如弦理论家、《宇宙的琴弦》作者布赖恩·格林(Briane Greene)为5,曾饰演《纯真年代》的女星丹妮卡·麦凯拉(Danica McKellar)为6……

好莱坞版、数学家版之外,还有个流行音乐版的,它是以重金属乐团黑色安息日(Black Sabbath)为中心的。于是乎,就又有人发明了个更强大的「埃尔德什-贝肯-黑色安息日数」(Erdos-Bacon-Sabbath number),能拥有此数的已经不是一般的牛人了:

  • 查德·费曼(Richard Feynman):14
    • 埃尔德什数:3;
    • 贝肯数:3(出演过1980年电影《Anti-Clock》);
    • 黑色安息日数:8(玩过鼓)
  • 娜塔莉·波特曼(Natalie Portman):13
    • 埃尔德什数:5(归功于她在哈佛读心理学时写的论文)
    • 贝肯数:1
    • 黑色安息日数:7
  • 布赖恩·梅(Brian May):11!!!
    • 埃尔德什数:7(2007年得到了天体物理学博士,还是利物浦约翰莫尔斯大学校监呢)
    • 贝肯数:3(献声96年动画电影《木偶奇遇记》)
    • 黑色安息日数:1(皇后乐队吉他手)

除了上面所有这些,其他某些领域也有类似的变种,如围棋界的秀策数(本因坊秀策)、UFO界的斯特林菲尔德数(Leonard H. Stringfield)等等。

嗯,已经东拉西扯了那么多,就到这吧。


  1. (2018年更新)今年我在Journal of Geophysical Research上发了篇paper后,我个人的埃尔德什数变成了6,希望能早日升到5吧