基于MogoDB数据库的临床医疗大数据挖掘案例分析

基于MogoDB数据库的临床医疗大数据挖掘案例分析胡皓皓胡昌盛DOI:10.16660/j.cnki.1674-098X.2011-5640-8970摘要:隨着医疗大数据时代的到来,从大量原始数据中挖掘出相关有用的信息,对治病防病及医疗决策进行有效辅助,起到非常好的作用。本文基于MongoDB数据库,利用Python编程语言,编写数据处理程序,通过将原始的多个数据表入库转换,找出已治愈患者,在此基础上找出复燃、复发患者并筛选出没有重复的数据;通过多进程提高处理速度。最后结果达到了预期,为相关医务人员提供了诊断及决策依据。关键词:PythonMongoDB数据库大数据数据挖掘:TP311:A:1674-098X(2021)01(c)-0108-03ACaseStudyofClinicalMedicalBigDataMiningBasedonMongoDBDatabaseHUHaohao1HUChangsheng2*(1.SouthChinaInstituteofSoftwareEngineering,GuangzhouUniversity,Guangzhou,GuangdongProvince,510990China;2.GuangzhouUniversityofChineseMedicine,Guangzhou,GuangdongProvince,510006China)Abstract:Withtheadventoftheeraofmedicalbigdata,miningrelevantusefulinformationfromalargenumberoforiginaldataplaysaverygoodroleineffectivelyassistingthetreatmentandpreventionofdiseasesandmedicaldecision-making.Inthispaper,basedonMongoDBdatabase,usingPythonprogramminglanguage,wewriteadataprocessingprogram.Throughputtingtheoriginaldatatablesintothedatabaseandtransforming,wefindoutthecuredpatients.Onthisbasis,wefindouttherecurrentpatients,andscreenoutthedatawithoutduplication.Weimprovetheprocessingspeedthroughmulti-processing.Finally,theresultsachievedtheexpectedresults,andprovidedthebasisfordiagnosisanddecision-makingforrelevantmedicalstaff.KeyWords:Python;MongoDBdatabase;Bigdata;Datamining医疗机构作为医疗行业的重要载体,保存大量的患者的原始数据。早期,大部分医院原始数据的记录大都保存在Excel电子表格中,表格多,数据量大,少则十多万条,多则几百万条。单独通过电子表格进行数据统计功能非常有限,而且处理速度慢,对深度数据挖掘没有什么作用。本文笔者通过Python编写语言,结合MongoDB数据库编写程序,把原始数据中的多表进行关联并进行条件筛选,通过多次优化进程,挖掘出相应结果。具体编程处理流程分多步进行。1设计具体流程设计具体流程如图1所示。2数据转换及导入MongoDB是一种NoSQL数据库,MongoDB可以实现多类数据的一体化存储、统一规则访问及多样性查询、关联检索等功能。将xls格式的2011~2019年某省某某病患者数据文件全部导入到MongoDB中。通过将病案基本信息表关联其他四个表(痰涂片检查、痰培养检查、X线和治疗信息)的信息,匹配的条件是病案ID和登记号,得到集成病案信息表。这一步获得五个大表和一个总表,如表1。3找出已治愈的患者从第一步得到的病案基本信息表里面筛选出已治愈的患者记录(包含221357条记录)并导入治愈患者信息表,其中主要伪代码如下:输入:病案基本信息表输出:治愈患者信息表对病案基本信息表的每条记录R:{如果(R[“诊断结果”]∈[“涂片阳性”,“仅陪阳”,“仅分子生物学阳性”]或R[“分子检出结果”]==“检出”)且R[“停止原因”]∈[“完成疗程”,“治愈”]:{将R加入治愈患者信息表}}筛选条件是:“诊断结果”是“涂片阳性”、“仅陪阳”或者是“仅分子生物学阳性”,或者“分子检出结果”是“检出”。除此之外,“停止原因”是“完成疗程”或“治愈”。然后再进行去重(即找出不重复的患者)并输出一个csv格式的文件。去重的条件是有相同的患者姓名、出生日期和性别,或者有相同的身份证号,或者有相同的患者姓名、出生日期和患者联系电话。去重去掉的是治愈患者第一次治愈记录之后的全部治愈记录。去重之后治愈患者信息表中还有217885条记录。4找出复燃、得发患者遍历上一步得到的治愈患者信息表csv文件,在病案基本信息表中找出复燃、复发患者的所有初次治愈(包含初次治愈记录)后的记录:对csv中的每一条记录:果身份证号不为空,用身份证号查询病案,...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供参考,付费前请自行鉴别。
3、如文档内容存在侵犯商业秘密、侵犯著作权等,请点击“举报”。

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

客服邮箱:

biganzikefu@outlook.com

所有的文档都被视为“模板”,用于写作参考,下载前须认真查看,确认无误后再购买;

文档大部份都是可以预览的,笔杆子文库无法对文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;

文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为依据;

如果您还有什么不清楚的或需要我们协助,可以联系客服邮箱:

biganzikefu@outlook.com

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

文秘专家
机构认证
内容提供者

1

确认删除?