首页 电商 正文

个性化推荐引擎:社会网络分析

扫码手机浏览

00:00
--:--
本文研究了四个社会网络Orkut, Youtube, Flickr和LiveJournal,这四个网络都同时包含了用户和用户的朋友关系网络,以及用户加入小组网络,前者一般为friendship,后者一般为membership。本文的研究证实了之前的···

图片来源@Unsplash,基于CC0协议!

本文研究了四个社会网络Orkut, Youtube, Flickr和LiveJournal,这四个网络都同时包含了用户和用户的朋友关系网络,以及用户加入小组网络,前者一般为friendship,后者一般为membership。本文的研究证实了之前的幂律,小世界以及scale-free等性质。另外本文的研究也证实了这几个网络都具有同配性,即那些度大的节点倾向于链接度大的节点。这篇文章有一些结论值得我们借鉴用于推荐系统。

问题定义:

表1是这几个网络的一些统计特性:

本文的数据是从网站上爬取下来的,所以并没有包含所有的网络数据,但是包含了网络的最大结构(connected component)。

首先是幂律分布,如下图所示:

可以看出,这几个数据节点的度都符合幂律分布,下表是这几个网络对应的幂律指数。

另外下图给出了网络中节点的比例与这些节点的连入边(入度)和连出边(出度)占整个网络边的比例。从图中可以看出,5%的节点连入边占整个网络所有连入边的75%,但是连出边只占了25%。这与微博的情况比较类似,在微博里面,有少许的明星节点,受到大部分人的关注,但是他们关注的人却占了很少部分。

下图给出了top x%节点出度和入度重叠的比例。例如在出度和入度top 1%的节点中,至少有65%是重叠的,换句话说,入度大的节点一般来说,出度也比较大。

下表给出了网络的平均距离和直径,可以看出这些网络偶表现出小世界现象。

下图是当网络中度最大的节点被移除后,网络的链接情况。当去掉网络1%度最大节点,网络中的最大连通结构还存在,但是去掉了10%之后,网络的结构就被完全破坏,剩下许多孤立的节点。

下表给出了网络的聚集系数,可以看出u,这几个网络都表现出高聚集性。

另外,本文也计算了几点度与节点的聚集系数的关系。从下图可以看出,那些度越小的节点,他们的聚集系数越大,而那些度越大的节点,他们的聚集系数反而越小。

------------------------------------------------- -------------------------------------------------

题目:Measurement and Analysis of Online Social Networks

社会网络分析

作者:Alan Mislove, Massimiliano Marcon, Krishna P. Gummadi, Peter Druschel and Bobby Bhattacharjee

期刊:IMC’07, October 24-26, 2007, San Diego, California, USA

链接:http://conferences.sigcomm.org/imc/2007/papers/imc170.pdf

转自:个性化时代

本文转载自互联网,版权归原作者所有,转载目的在于传递更多的信息,并不代表本网站的观点和立场。部分文章推送时未能及时与原作者取得联系,如发现本站文章存在内容、版权或其它问题,烦请告知,我们将及时删除。

推荐文章