百度大数据部面试

百度大数据部面试篇一:百度大数据部面试大约一个月前,笔者接到百度的面试电话,去应试数据分析员的工作。尽管无意去工作,但是还是希望能看看他们的测试题毕竟是怎么样的。于是接触到了一下的题目:总共十个题目(当然全是excel函数题):1、根据员工的身份证号,统计员工的生日。众所周知,我国居民身份证号有18位和15位数之分。对于同样位数的身份证号统计想必不是很难,但是混杂了两种状况的统计怎么来做呢?背景材料:15位的身份证号码:450104771010156(1)1~6位为地区代码(2)7~8位为出生年份(2位),9~10位为出生月份,11~12位为出生日期(3)第13~15位为顺序号,并能够判断性别,奇数为男,偶数为女。18位的身份证号码:450104197710101516(1)1~6位为地区代码,(2)7~10位为出生年份(4位),如1977(3)11~12位为出生月份,如10(4)13~14位为出生日期,如10(5)第15~17位为顺序号2、从备注材料中抽提其中的物料代码,代码的格式是“0000-00000〞,备注是文字和数字的混合。如“某某客户投诉0000-00000产品有质量问题,香气偏淡〞。让你写出函数从中提取出物料代码3、AB列各有N多个单字节文本,但其中个别单元格有空白。要求:B3单元格有文字就显示B3单元格,若B3无文字而A3有,则显示A3单元格文字,假如A3也没有文字,则显示“济南〞。4.有个物料库存区域,有诸多原料进仓数据,单个原料有屡屡进仓记录的,让统计部分原料的库存总数量。5、考勤状况统计。A代表上班,K旷工,S迟到,B病假,W出差依照日期记录每个员工的考勤状况。月底对员工考勤状况举行统计。6、小数点的取舍。保存小数点后两位,和截留取整。7、有一副用数字0填充单元格组成的图画,让改变该副图画的背景颜色。还有三个题时隔长久一时想不起了,道歉,只能发这几个题了。知道答案的可以在随后的评论中写出,猜不出的可以问我。----以下为本人收集的几种数据分析工具--1.QUESTQUEST是IBM公司Almaden研究中心开发的一个多任务数据挖掘系统,目的是为新一代决策支持系统的应用开发提供高效的数据开采根本构件。系统具有如下特点:提供了特意在大型数据库上举行各种开采的功能:关联规矩发觉、序列模式发觉、时间序列聚类、决策树分类、递增式主动开采等。各种开采算法具有近似线性(O(n))计算繁杂度,可适用于任意大小的数据库。算法具有找全性,即能将所有满意指定类型的模式全部寻觅出来。为各种发觉功能设计了相应的并行算法。2.MineSetMineSet是由SGI公司和美国Standford大学联合开发的多任务数据挖掘系统。MineSet集成多种数据挖掘算法和可视化工具,帮忙用户直观地、实时地挖掘、理解大量数据背后的知识。MineSet有如下特点:MineSet以先进的可视化显示方法有名于世。提供多种萃诰蚰J健0掷嗥鳌毓槟J健亓嬖颉劾喙椤卸狭兄匾取?br支持多种关系数据库。可以直接从Oracle、Informix、Sybase的表读取数据,也可以通过SQL命令执行查询。多种数据转换功能。在举行挖掘前,MineSet可以去除不必要的数据项,统计、集合、分组数据,转换数据类型,构造表达式由已有数据项生成新的数据项,对数据采样等。操作简单、支持国际字符、可以直接发布到Web。3.DBMinerDBMiner是加拿大SimonFraser大学开发的一个多任务数据挖掘系统,它的前身是DBLearn。该系统设计的目的是把关系数据库和数据开采集成在一起,以面向属性的多级概念为根基发觉各种知识。DBMiner系统具有如下特色:能完成多种知识的发觉:泛化规矩、特性规矩、关联规矩、分类规矩、演化知识、偏离知识等。综合了多种数据开采技术:面向属性的归纳统计分析、逐级深化发觉多级规矩、元规矩引导发觉等方法。提出了一种交互式的类SQL语言——数据开采查询语言DMQL。能与关系数据库平滑集成。实现了基于客户/服务器体系结构的Unix和pC(Windows/NT)版本的系统。4.EXCELMATLABOrigin等等当前流行的图形可视化和数据分析软件有Matlab,Mathmatica和Maple等。这些软件功能强大,可满意科技工作中的大量需要,但使用这些软件需要一定的计算机编程知识和矩阵知识,并熟悉其中大量的函数和命令。而使用Origin就像使用Excel和Word那样简单,只需点击鼠标,选择...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供参考,付费前请自行鉴别。
3、如文档内容存在侵犯商业秘密、侵犯著作权等,请点击“举报”。

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

客服邮箱:

biganzikefu@outlook.com

所有的文档都被视为“模板”,用于写作参考,下载前须认真查看,确认无误后再购买;

文档大部份都是可以预览的,笔杆子文库无法对文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;

文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为依据;

如果您还有什么不清楚的或需要我们协助,可以联系客服邮箱:

biganzikefu@outlook.com

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

文秘专家
机构认证
内容提供者

1

确认删除?