图片来源@Unsplash,基于CC0协议!
摘要:长期以来,许多网站都是信息孤岛,虽说搜索引擎能根据关键字罗列出一系列文章,但文章关联度与浏览便利性并不高。无觅网是基于网站互连的个性化阅读社区,利用人工智能技术、协同过滤算法为用户提供一站式阅读推荐服务。无觅邀请各大小网站加入了“无觅网络”,连接在一起的网站将共享资源,创造更多的价值,无觅的智能云端跨平台插件——“相关文章插件”可辅助网站用户向读者推荐更多的相关信息,其精准的相关算法使网站相关文章的转化率大大提高。在插件的辅助下,无觅网络与无觅网形成了很好的互补统一。通过分析无觅的产品框架,给出自己的一点意见。
关键词:无觅网,无觅网络,插件,推荐
1 引言
随着Facebook通过开放平台一炮走红,谷歌、微软等全球各大互联网公司开始竞相推出自己的开放平台战略,国内外对开放平台的前景一片看好。“云计算”实现了信息的自由和流通,也加速了开放平台的发展。未来的互联网有望成为一个开放、自由的世界。
传统的搜索引擎如百度、Google虽然能连接各网站,根据关键字过滤,向用户提供可能感兴趣的信息,但其文章相关度与便利性并不高,广告推广服务也使查询结果集变得不纯粹不理想。RSS实现了内容聚合,但还是有信息过载的问题,怎样有效地去过滤还需挖掘。
在这个背景下,无觅通过其精湛的产品框架向人们展示了初创团队的前瞻眼光与创新精神。于2010年1月上线的无觅网是一个社交型内容聚合网站,无觅网基于云计算向用户提供推荐服务,目标是在这个信息泛滥的时代,利用各种技术过滤用户不感兴趣的信息,让整个互联网变得更聪明、更个性化、更了解用户所需。
无觅的个性化推荐服务是国内使用最广的个性化推荐服务,无觅网目前的用户量规模非常庞大,每天给一些门户网站和独立博客带去的流量也非常客观。而无觅推出的相关文章插件已经占领了国内独立博客、论坛的大部分市场,一些大型门户网站也已经引入。图1是无觅网的logo。
图1. 无觅网logo
无觅网的目标用户是互联网信息的最终消费者,而无觅网络是面向站长用户的。无觅于2011年1月17日推出了“无觅网络”服务,它将所有使用了无觅相关文章插件的网站结成一张网,在这个网络里,网站主可向任意网站请求连接,征得同意后,连接在一起的网站将在相关文章里显示对方的内容,进而共享资源以创造更多的价值。无觅会确保文章的相关性、交换流量的公平性、防作弊等一系列的技术问题[1]。
简而言之,无觅网络把站外链接变成了无觅网络的“站内”链接。个体是无意识的,群体在整体的失控中却找到了方向。无觅的理念便是让互联网变得更聪明、更个性化,去实现该理念的基础是“1 + 1 > 2”。
2 无觅网络
无觅网络打通了网站之间的鸿沟,使得对于用户有用的信息不再分散于不同的网络节点,而是互联互通。无觅网络的出现一方面顺应并推动了互联网的开放互联进程,另一方面也为无觅更好地获取网站内容,为最终用户提供丰富、优质的信息提供了可能性。
无觅网络的个性化的推荐效果的关键在于庞大的数据、开放互联的多个网站,以及更为精准的相关算法。
从站长的角度上看,无觅插件使网站浏览量迅速飙升。许多新兴网站在起步时都需要在其它平台进行推广,常用方法是和其他网站交换友情链接、互访网站、互送IP、在一些论坛里留下网站链接等,通过这些方式提升网站知名度效果并不显著,而花这么多精力去寻找推广链接途径是一种资源的浪费。无觅的个性化推荐不会考虑网站的大小之分,只要这些网站安装了无觅插件从而加入了无觅网络即可享受平等的推广服务。假设你的网站有1万个读者,跟另一个网站连接,总读者数就变成2万,跟100个连接,总读者数就变成100万。文章喜欢的人多了浏览量自然就提升了,借助于社会化媒体的影响力,站长便可以把这些用于推广网站的时间节省下来用以创造更有价值的内容。无觅网络能一传十、十传百地聚合多个网站的相关内容,这种网络效应的规模大得惊人。
从读者的角度上看,阅读不再局限于同一个网站。当读者在某网站上看了“无觅插件背后的阴谋”的文章,他有可能接下去想看“关于《无觅插件背后的阴谋》一文的回应”,但这篇文章却是在另一个网站上。网站与网站没有连接前,读者会受限于单个网站的信息,而通过无觅,网站连接后便可实现信息互补。网站间的互联互通帮助用户发现价值信息,为用户提供一个更加流畅的阅读体验,这种方便性却非百度、谷歌等搜索引擎所能及。
2.1无觅“相关文章插件”
为了脱离一般插件的受限,无觅采取了云计算的模式实现文章个性化推荐功能。无觅相关文章插件是第二代博客插件,因为它是国内首个基于云计算技术的跨平台博客插件。
无觅将相关文章的分析和推荐算法放到他们的云端服务器,这种云端处理技术可以降低博客服务器的负担,大大提高博客访问速度。插件端的主要工作就是发个请求给无觅服务器,无觅服务器便返回相关文章。这种做法一来不会对网站主的服务器造成任何压力,二来也给无觅带来了很大的空间去创新。无觅可以进行任何复杂的算法去计算相关度,做需时较久的图像视频处理,只需把结果缓存起来就行。国外也有几家网站采取类似的模式,但对于中文网站文章的相关度总是强差人意。因为有了创新的空间,无觅相关文章插件现在给网站多带去平均10%-20%的页面访问量。
网站在添加无觅个性化推荐应用之后,可以由无觅提供个性化推荐算法,结合用户的阅读偏好,向每一位来访的读者推荐最符合其需要的网站内容。通过精准的推荐,让读者有了更好的阅读体验,帮助其发现了更多的价值信息,同时增加了网站的用户黏度和站内停留时间。这种相关性算法本身已经突破了传统基于标签或者分类的推荐机制,使得相关性和点击率大大提升。再加上其作为云端服务,能动态生成推荐结果,通过用户的点击反馈和机器学习,实时优化推荐结果。这种关联推荐技术已经不是传统相关文章可以匹敌的[2]。
添加了此应用的网站无需再为个性化推荐开发复杂的系统和算法,更无需增加服务器成本,一切功能都由无觅免费提供,而用户访问的所有内容均位于网站内。
网站本身只需要添加一小段HTML代码便可以实现以前需要耗费大量人力和服务器成本才能够实现的个性化推荐功能。在无觅网站管理中心,无觅提供了完全的CSS编辑功能,网站主可以随心定制最符合网站整体结构和风格的个性化推荐应用展示方式。通过自定义样式设置,个性化推荐应用可以完全融入网站主体,成为网站的自有内容,为网站带来最大的收益[3]。图2是无觅个性化推荐应用的样式:
图2. 无觅云计算个性化推荐
2.2无觅“喜欢&推荐”按钮
无觅的个性化推荐算法和相关文章插件的海量用户让“喜欢”和“推荐”按钮的推出水到渠成。无觅“喜欢&推荐”按钮是无觅基于个性化推荐系统推出的面向网站用户的应用,目的是为了给读者提供更个性化的浏览体验。
无觅的“喜欢”按钮相对Facebook Like按钮、国内人人网的“喜欢”按钮、以及Google +1而言更加侧重于个性化推荐,这也是在互联网的海量信息中为用户找到价值信息的方式之一。所有使用了无觅相关文章服务的网站无需添加其他任何代码便可以使用这款产品,而在添加了无觅的“喜欢”按钮后,访客无需开通无觅网账户,更不需要登录无觅网就可以在任何网站上对任何文章表示喜欢。喜欢得越多,推荐的信息也会越准确。该按钮可以实现三种功能:
(1)得到更个性化的推荐:当用户点击“推荐”时,无觅会结合用户的喜欢历史,向其推荐当前网站上他还会感兴趣的内容,以帮助用户发现价值信息;
(2)自动保存“喜欢”过的内容:当用户点击“喜欢”后,会将喜欢的数字+1。如果用户已登录,则“喜欢”的信息会即时同步到无觅网中;
(3)分享给更多朋友:用户的这些“喜欢”可以分享到无觅网以及用户在无觅网绑定的其他社区,比如同步到豆瓣等国内主流的社交媒体,进而也让更多用户了解到网站的内容。
“推荐”按钮则会根据用户点击“喜欢”的数据列出读者最感兴趣的内容。用户“喜欢”过的文章越多,得到的推荐也越准确。“推荐”按钮一方面通过个性化推荐增加了网站的用户浏览量和站内停留时间,另一方面也为用户发现网站的价值信息提供了有力帮助,为用户提供了流畅的阅读体验。如果后续无觅能够将这里的“推荐”按钮整合进无觅网络的内容,那样这样一个按钮的价值便可以真正无限放大[4]。
无觅的“喜欢”功能支持在文章底部无觅相关文章插件上方显示喜欢按钮,同时喜欢按钮旁边还多了一个“推荐”。图3是无觅“喜欢&推荐”按钮的几种样式:
图3. 无觅“喜欢&推荐”按钮的样式
无觅网络一方面为站长带去了流量,另一方面也使无觅网得以提供更好的网站内容,为最终用户提供丰富、优质的信息提供了可能性。通过微博链接功能,无觅可将网站主的内容自动同步到微博。用户在无觅网的评论自动聚合到网站主的微博。这些功能,既增强了网站的社会化,又给网站主带来了社会化流量。从另外一个层面上来讲,这既是网站的社会化营销,又是对网站评论功能的拓展和强化[5]。
3 无觅网
在无觅网,用户可以挑选自己喜欢的话题,并得到关于这些话题的推荐内容;还可以关注感兴趣的其他用户,了解他们的阅读动态。无觅网利用人工智能技术根据用户阅读和喜欢过的内容,向用户推荐更多可能会感兴趣的内容。
3.1实时推荐
无觅网可以根据用户的喜好实时推荐文章。推荐依据有很多,比如文章设置的标签、标题中的关键字(主题、人物)、朋友推荐、文章热门度、页面逗留时间。同时,在阅读推荐文章时,你可以点击“没兴趣”表示不喜欢这篇文章,刷新后,无觅的推荐能迅速做调整,而点击“已看过”则可过滤本条目。
图4. 无觅实时推荐
3.2文章收藏
登陆无觅网的用户在其它网站点击“喜欢”后,除了会将喜欢的数字+1之外,其所有喜欢的记录会同步到无觅网,存于用户帐户中作为后续无觅为用户推荐和发现价值信息的依据,也便于用户日后查看和检索;
图5. 无觅能同步用户“喜欢”过的文章
3.3频道推荐
无觅还推出了类似豆瓣9点的“频道”功能,结合“喜欢”,用户可以获得某博客最新文章,最热文章和跟你兴趣相关的推荐文章。频道推荐方面,无觅尚有改进的空间,比如推荐的这些网站都是固定的,若是能由用户自己DIY,或许能进一步满足用户需求。
图6. 无觅的频道推荐
3.4好友关注
无觅网络的灵魂是协同过滤,协同过滤法的原理非常简单,就是基于人有相似、物有相近,要推荐文章给你,只需找到与你口味相近的人,把他们喜欢看的而你还没看过的文章推荐给你,很大可能上你也会喜欢[6]。
如今,社会化媒体的影响力越来越大,无觅也引入了一些社会化的元素。除了上文讲的个性化推荐之外,无觅还会展示你关注的好友“喜欢”的文章,以及“喜欢”了你“喜欢”的文章的人,为你调整好友关注提供了参考,这就是社会化应用到无觅推荐的例子。个性智能的信息推荐系统通过相关信息的社交属性也把有相同兴趣的用户联系在了一起。
好友关注方面,无觅网与人人网、新浪微博等SNS网站是有区别的,这需要使用者的理解。要想使无觅网的推荐更加精准,你可以根据无觅网的推荐好友服务,关注一些与你兴趣相投的朋友(当然包括陌生人),比如说如果你是做Android开发的,你就可以关注同行人士,这样无觅网推荐给你的文章符合度就能更高。图7是无觅的最新提醒样式:
图7. 无觅提醒
4 对比
4.1 linkwithin VS 无觅
推荐相关文章方面,国外的linkwithin很多时候几乎是随机的,对中文博客的支持、自定义设置有时不能满足需求。相比之下,无觅的优势在于:
(1)无觅对中文博客的支持较好;
(2)文章的相关性较高,也获得了国内许多博客主的认可;
(3)无觅网站管理中心让网站用户可以进行一系列的自定义设置,查看网站收录概况等等,这些linkwithin尚不具备;
(4)无觅提供了更多的选项。linkwithin无法嵌入Feed,也就无法将推荐文章加入RSS Feed。相比之下,无觅支持在RSS里显示有图片的相关文章,能把读者从reader带到网站去,对RSS订阅数较高的网站意义较大[7]。
当然,网站都是在进步,linkwithin支持性也可以改进,只是linkwithin较难做到很好地本土化,比如在提高文章的相关性方面,需要很好地语义分析。当技术的实现不再是桎梏,这或许才是linkwithin真正的难题。图8是linkwithin的相关文章插件:
图8. linkwithin的相关文章插件
4.2 RSS聚合网站VS 无觅网
在RSS聚合网站中,读者可以阅读他们通过RSS订阅的信息,相应的网站也可以提升访问量。在“一站式”方面,无觅网与RSS聚合网站是相通的。然而,阅读除了聚合之外,还有选择的问题,在信息过载的年代,怎样有效地去过滤信息才是最有价值的地方。
相比以聚合为主的RSS聚合网站,无觅的主打旋律则是个性化推荐。无觅插件是无觅整个战略的一个重要基石,其深刻意义在于索引和聚合数据,通过对索引数据的挖掘和语义分析,以及无觅网自身的社交元素所产生的用户行为分析,一方面不断提高无觅插件相关文章的匹配度,另一个重要的方面就是提供更加个性智能的信息推荐系统。
4.3 Google +1 VS 无觅“喜欢”和“推荐”按钮
几乎是与Google +1发布的同时,无觅网也推出了无觅“喜欢”和“推荐”按钮。Google +1的两个功能是增强搜索引擎的社会化与优化搜索结果。
不论是Google +1还是无觅的“喜欢”“推荐”,都体现了社会化及个性化的趋势。而无觅的“喜欢”和“推荐”按钮相对Google +1更加侧重于个性化推荐,这也在互联网信息越来越海量的情况下帮用户找到价值信息的方式之一。
5 结束语
如今,无觅的产品框架已逐步清晰,无觅的愿景是打造一个个性化互联网,也就是根据用户的个性化需求推荐对其有价值的信息,并且协助用户发掘新的价值信息。要实现这一目标就需要两个条件,一个是对用户个性化特征信息的获取,另一个是对互联网海量信息的获取和筛选[9]。
首先是获取用户个性化特征信息,由于无觅拥有用户的兴趣、浏览历史、评论、人脉等特征信息,所以在用户的隐私问题上,无觅还需要打消用户的顾虑。是否尊重用户隐私一直是衡量一个公司道德程度的标尺,而雅虎却痛快淋漓地交出属于隐私的用户信件,又有Cisco为了生意,不惜参与互联网过滤工程。可想而知,若是无觅将用户的个人信息用于商用(比如通过数据挖掘、模糊分析过滤出用户性格,将数据出售给电商企业用以进行网络营销),那么结果会很可怕。何况,近日的“泄密门”事件愈演愈烈,用户信息泄漏这把熊熊大火,也从社区类网站烧到了电子商务网站、政府网站,导致支付宝、京东、当当等电商网站以及部分政府网站的用户信息均遭到一定程度的泄漏。一个网站了解用户越深,推荐就能越精准,但用户的隐私也会越不安全。
其次是对互联网海量信息的筛选,包括抓取互联网价值信息和对海量信息进行分析和多维度分类。无觅采取两种方式获取互联网信息,一类是对优质互联网信息集中地进行内容定向抓取,类似于搜索引擎,只是目前无觅抓取的范围还没有开放到全网;第二类是通过为站长提供相关文章插件获取网站内容[9]。通过无觅相关文章插件,无觅获得了其它网站的内容,为后续的内容分析和个性化推荐提供了可能,另一方面,无觅也类似一淘网、团购网站,凭借无觅平台为无觅网络的成员做了推广。如今,凭借精准的推荐功能,无觅相关文章插件在不到两年的时间里迅速占领了中文博客、论坛、门户网站的大片土地,然而,相比百度等搜索引擎,无觅的“网”显然还不够大。无觅与无觅网络用户共生共赢,如果其它站长们不愿对无觅开放,那么无觅则会漂浮无根,所以无觅还需通过无觅插件、开放平台等方式赢得站长们的认可,同时进一步加大内核,进而形成了一个良性的系统。
输出决定输入,无觅网的盈利点在于对于网站的推广价值,但其最终服务的仍是互联网信息的终端消费者。对于读者而言,阅读进化是从信息缺失向信息过载发展的,所以无觅需要在网站与读者之间找到一个平衡点,既要为网站用户提升流量,也要使读者用户满意。
无觅的个性化推荐系统真正的威胁正是来自于搜索引擎和浏览器厂商。相对于无觅通过插件征服用户,Google、腾讯甚至有自己的浏览器,能收集到的用户行为远远多过一个插件,而这些大企业会不会进军内容个性化推荐领域则是另当别论了。如今国内大部分市场份额已经被百度、阿里、腾讯等几个大阵营瓜分了,一些初创阶段小公司也只能狭缝中求生存。相比来说,基于网站互连的无觅比较专一,也很有潜力。但是要把潜力化为胜利,仍然是一条荆棘路,无觅的进一步发展势必会遇到许多挑战。
推荐的精准度是决定无觅网成败与否的关键,所以无觅的重要战略还是在其信息处理和算法分析上。从设备上来说,无觅的数据库需要存储每位阅读用户的阅读喜好、人脉关系等,而且所有的推荐算法都是放在服务端上运行的[10],当用户越来越多时,要实现精准推荐对服务器来说也是非常沉重的;从技术上来说,虽然目前无觅的相关推荐已经很优秀,但精准度仍有很大的提升空间,当然这需要很长时间去探索研究。互联网信息组织先后经历了门户式、搜索式、分享式三个阶段,发展到现在,基于时间和场景的个性化内容服务将是下一代互联网信息组织最具前景的模式。除了信息过滤推荐外,无觅也自带了搜索功能,具有了浓缩版搜索平台的特征,如果推荐算法时效性能更加突出、发散能力更强的话,补上一个发布中心,无觅可能成为一个信息开放、终端分散的新闻平台。
参考文献
[1] http://baike.baidu.com/view/4986816.htm.
[2] http://www.admin5.com/article/20110718/362345.shtml.
[3] http://blog.wumii.com/?p=435.
[4] http://www.chinaz.com/news/2011/0408/170901.shtml.
[5] http://www.admin5.com/article/20110718/362345.shtml.
[6] http://www.admin5.com/article/20101217/299822.shtml.
[7] http://tech.qq.com/a/20101231/000211.htm.
[8] http://www.ainsect.com/archives/6339.
[9] http://yanyi.ws/discovery-the-blueprints-of-wumii.
[10] http://www.liuya.org/2011/01/01/964.