2021年百度校招数据挖掘工程师笔试题目

百度校招数据挖掘工程师笔试题目xx百度校招数据挖掘工程师笔试题目时间:xx-9-20笔试职位:机器/数据挖掘工程师笔试城市:天津、深圳、南京等一.简答题1.new和malloc的区别。2.hash冲突是指什么?怎么解决?给两种方法,写出过程和优缺点。3.命中的概率是0.25,若要至少命中一次的概率不小于0.75,则至少需要几次?二.算法设计题1.用C/C++写一个归并排序。数据结构为structNode{intv;Node*next};接口为Node*merge_sort(Node*);2.设计S型层次遍历树的算法,比如根节点是第一层,第二层从左至右遍历,第三层从右至左遍历,第四层再从左至右遍历,以此类推。举例:应依次输出123654789。3.一个url文件,每行是一个url地址,可能有重复。(1)统计每个url的频次,设计函数实现实现。(2)设有10亿url,平均长度是20,现在机器有8G内存,怎么处理,写出思路。三.系统设计题自然语言处理中的中文分词问题,前向最大匹配算法(FMM)。注:题目举例说明了FMM的基本思想。(1)设计字典的'数据结构structdictnote。(2)用C/C++实现FMM,可选接口为intFMM(vectoriLetters,dictnode*iRoot,vector*oResults);其中iLetters为待分词的句子,比如{“小”,“明”,“今”,“天”,“买”,“了”,“i”,“p”,“o”,“n”,“e”,“6”},iRoot是字典,oResults保存输出结果,即分词的位置。也可以自己设计接口。(3)收集了一些手机品牌的字典,如{iphone,诺基亚}。现在要求查找包含这些手机品牌的网页,比如包含iphone6,诺基亚9973等。怎么修改FMM实现这个功能,可以写伪代码。模板,内容仅供参考

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供参考,付费前请自行鉴别。
3、如文档内容存在侵犯商业秘密、侵犯著作权等,请点击“举报”。

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

客服邮箱:

biganzikefu@outlook.com

所有的文档都被视为“模板”,用于写作参考,下载前须认真查看,确认无误后再购买;

文档大部份都是可以预览的,笔杆子文库无法对文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;

文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为依据;

如果您还有什么不清楚的或需要我们协助,可以联系客服邮箱:

biganzikefu@outlook.com

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

笔杆子文秘
机构认证
内容提供者

为您提供优质文档,供您参考!

确认删除?