厦门大学学报(自然科学版)第50卷第3期2011年5月Vol.50No.3JournalofXiamenUniversity(NaturalScience)May2011中医察目望神规则挖掘的关键技术锋1,2,李绍滋1,23郭,戴莹3,周昌乐1,2,林颖1,2(1.厦门大学信息科学与技术学院,福建厦门361005;2.福建省仿脑智能系统重点实验室(厦门大学),福建厦门361005;摘要:中医客观化中有一个很重要的问题是根据量化的人体特征推导出人体的状态.提出了一种用于中医察目望神客观化中从眼部特征推导出人体“神”的状态的规则挖掘方法.首先给出了视频采集方法,接着使用类2属性依赖最大化方法(CAIM)对眼部特征数据进行离散化形成规则挖掘中的属性区间,然后使用云模型进行关联规则挖掘得到大量候选规则,再对3种互补的规则裁剪方法进行修改和组合用于候选规则的整理,并形成最终的规则集合.利用交叉验证法检验规则挖掘的效果,得到了93%的平均精确度,达到了很好的效果.关键词:察目望神客观化;云模型;类2属性依赖最大化方法;规则裁剪中图分类号:TP391文献标志码:A文章编号:043820479(2011)0320525206望诊是中医诊断学中四诊的重要内容之一,而望神在望诊中又是不可或缺的.“神”是机体功能正常与否的外在表现,有神者则表明五脏功能正常或病情较轻,若五脏功能衰败,病情较重则为失神.神的表现形式一般分为5种:得神、少神、失神、假神及神志失常.本文的主要目的是根据获取的眼部特征,以及医生对其“神”的状态的标注,挖掘出眼部特征到神的关联规则,从而实现对人体状态的自动判断.近20年来,中医诊断信息提取与处理主要围绕着脉象和舌象信息的提取与处理技术展开的.在望诊方面,最近5年舌诊信息处理技术有着极大的发展,并已经开始了实用化的临床应用.相比而言,同样属于中医望诊重要内容的神色信息提取与处理方面的研究却还处在空白阶段,目前尚无这方面的研究报道.北京工业大学信号与信息处理研究室与北京市中医院合作开发的中医舌像分析仪能够采集、察看、存储数字化彩色舌图像,实现彩色舌图像的真实重现,并具有自动分析常见舌像特征的功能[1].上海中医大学与厦门大学中医信息处理联合实验室开发的“WZX舌色头面神色诊断方面,目前研究的主要有:厦门大学毛红朝等根据中医中常用的类比推理,建立了一个标准的病症库[3].另外,上海中医药大学许家佗等公开了一个舌象与头面部中医望诊信息采集装置[4].关联规则的概念和模型首先由Agrawal等[5]在1993年提出.之后,出现了一系列的关联规则挖掘算法,这些算法有:哈希技术算法[6]、分块技术算法[7]、抽样算法[8]、动态项集技术算法[9]、增量挖掘算法[10]、并行和分布式挖掘算法、关联数据库系统集成挖掘算法.在规则挖掘完成之后的剪裁工作也是十分重要的,该步骤可以清除冗余、精确度不够的规则.经常被使用的规则裁剪方法有χ2检测、冗余规则裁剪、数据库覆盖、懒剪枝以及悲观估计等.本文将中医察目望神进行了客观化,提出了全新的数据采集方法,研究了将类2属性依赖最大化中医察目望神原理及程序流程1本文将眼部特征进行量化,结合医生给出的身体状况的诊断,归纳出相应的规则,从而当输入新的眼部特征时,能够自动判断出其神的有无、多少,即神的状态与相应的身体状况是对应的图所示为中医察收稿日期:2010203211基金项目:国家自然科学基金项目(60672018);深圳市科技计划基础研究项目(JC200903180630A)3通信作者:szlig@xmu.edu.cn部视频以及参数设定,并传给特征获取模块;在特征获取模块中,我们使用了计算机视觉与图像处理的多种方法获取与身体状态相关的眼部特征并以数值的形式进行保存;医生通过对受试者的诊断判断其神的状态,并与该受试者的眼部特征记录在一起作为一条记录,该诊断结果为将要生成规则的后件;由于眼部特征数据是连续的,因此本文首先使用CAIM方法将其离散化从而形成若干区间;眼部特征以及神的概念具有模糊性,无法准确进行区间划分,在文献[11]中发现,云模型在挖掘模糊边界的关联规则具有很好的效果,因此本文使用云模型进行规则挖掘;挖掘出的大量规则,本文使用3种互补的方法进行裁剪,并形成最终需要的规则集合.本节将详细描述视频采集的步骤,以及所获取的眼部特征,并给出部分实际数据记录,关于特征数据离散化,基于云模型的关联...