LinkedIn职业网络中的数据挖掘应用

摘要:近年来,社交网络发展迅速,各种社交的网络平台每天都会产生海量的用户数据。这些无序的数据中隐藏着潜在的价值,也为研究者提供了用数据挖掘中的方法来分析这些数据的机会。聚类是数据挖掘中的一个基本技术,而利用聚类方法我们能够实现Linkedln职业网络中的数据挖掘。关键词:社交网络;数据挖掘;应用;聚类;Linkedln职业网络中图分类号:TP301文献标识码:A文章编号:1009-3044(2016)13-0001-02Abstract:Inrecentyears,withtherapiddevelopmentofsocialnetwork,thedifferentsocialnetworkingsitesproducelargeamountsofuserdataeveryday.Thereispotentialvalueinthesedisordereddata.Italsoprovidesresearcherswithopportunityofusingdataminingmethodstoanalyzethesedata.Clusteringisanessentialdataminingtechniques,andwecanachievedatamininginLinkedlnprofessionalnetworkwiththeuseofclusteringmethod.Keywords:socialnetwork;datamining;application;clustering;linkedinprofessionalnetwork社交网络,顾名思义是用于社交的网络平台,它最初是以交友为开端的,在社会的不断发展中逐渐演变成了今天的集社交、通讯、娱乐、商业等元素为一体的多元化平台。基于网络的社会交往诞生于早期的基于终端的计算机,以及通过新闻组或其他早期的互联网软件来进行。社交网络的新时代开始于互联网的性能的上升,以及万维网(Web)的逐渐占据主导地位。近年来,国内的新浪微博、人人网,国外的Facebook、Twitter和Linkedin等社交网站,也己经从时尚变为主流。而社交网络的爆发之所以能在最近几年爆发,很大程度上是由于社交网络和媒体共享网站提供了大量的用户数据。而如何对这些海量数据进行高效的分析和处理,也决定了社交网络今后的发展。1社交网络数据分析概述网络和信息技术的飞速发展使得社交网络成为人们生活中不可缺少的一部分。网络设计采用电子邮件作为一个起点,而不是实际生活中的信件。然后幵心网,BBS等网站,是由它演变,并且以虚拟为其主要特色。在社交网络演进的过程中,个人的形象由实际生活中的具体个人转化为一个虚拟形象。所有的这一切都归功于社交网络的诞生,然后又驱使人们提出网络扩展和降低成本的特征之间的联系。良好的社交网络数据分析技术可以在社交网络的爆炸式发展的过程中为用户们创建一个积极乐观的网络环境和氛围。流行的社交网络如今被认为是社交加网络,即通过将网络作为载体,将很多的用户连接以形成具有一定特性的虚拟社区。和基础科学不同,对社交网络的数据分析重点是人与人之间的相互联系[1],而不仅仅是独立个体的属性。社交网络分析就是研究这种社会结构的它主要检查关系之间的结构和组成,并分析其结构特点[2]。通常包括:1)个体的邻接点之间是如何连接的;2)彼此之间经常进行通信的个体[3](社区);3)通过网络传递信息所涉及的个体数[4](路径长度);4)实际网络中可能存在的关系的比重[5](密度)。2数据挖掘在社交网络中的具体应用——Linkedln中的职业网络聚类2.1Linkedln中数据挖掘的意义Linkedln是全球最大的职业社交网站,它主要关注用户的职业和相互之间的商业关系,即“人脉”。Linkedln的理想定位为年轻职业人员,被广泛地用于构建和维护外部职业网络。因为Linkedln的管理团队认为用户的职业数据本质上是私有的,并且这些数据非常宝贵,不能像Facebook或Twitte上的好友那样任意查看。由于这类数据的敏感性,Linkedln中API提供的数据和一般社交网站是有本质区别的[6]。Linkedln限制用户访问自己“一度人脉”的某些信息,因此它不适用于作为图挖掘。本章下面的内容将介绍如何用基本的聚类分析来帮助用户找到以下几个问题的答案:1)你的哪些“人脉”和你的职位最相似?2)你的哪些“人脉”曾在想去的公司工作过?3)你的大多数“人脉”住在什么地方?2.2使用聚类分析的动机聚类分析可以作为一个单独的工具被用以发现数据库中分布的一些深层的信息,然后归纳出每一类的特点或者把注意力放在某一个特定的类上以作进一步的分析[7]。对于Linkedln的大量数据,在实现上一节中提到的数据挖掘时,我...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供参考,付费前请自行鉴别。
3、如文档内容存在侵犯商业秘密、侵犯著作权等,请点击“举报”。

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

客服邮箱:

biganzikefu@outlook.com

所有的文档都被视为“模板”,用于写作参考,下载前须认真查看,确认无误后再购买;

文档大部份都是可以预览的,笔杆子文库无法对文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;

文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为依据;

如果您还有什么不清楚的或需要我们协助,可以联系客服邮箱:

biganzikefu@outlook.com

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

确认删除?