模糊理论在信息检索上的应用1994-2009ChinaAcademicJournalElectronicPublishingHouse.Allrightsreserved.wwcnki信息系统与网络模糊理论在信息检索上的应用李郎达(吉林大学图书馆,长春130012)摘要模糊理论是为了解决真实世界中普遍存在的模糊现象而发展的一门学问。模糊理论以模糊集合为基础,基本精神是接受模糊性现象存在的事实,而以处理概念模糊不确定的事物为其研究目标,并积极地将其严密量化成计算机可以处理的信息。本文首先简介模糊理论,而后将模糊理论在信息检索上的应用做一探讨。希望通过本文,使大学对模糊理论有更深入的了解,并且思考如何将之更广泛地应用于图书信息学上。关键词模糊理论模糊集合信息检索G25217文献标识码A100727634(2004)0320343203ApplicationofFuzzyTheoryinInformationRetrievalLiLangda(Libraryof激linUniversity,Changchun130012)AbstractComparedtotraditionalinformationretrieval,Theapplicationoffuzzytheorycanincreasetheaccuratedegree1Inthispaper,wediscusstheconceptoffuzzytheoryandthemodelcanbeappliedininformationretrieval1KeywordsFuzzytheoryFuzzysetsInformationretrieval收稿日期:2003-05-031模糊理论简介Fuzzy原意是绒毛状、朦胧、模糊的意思,中文大多译成“模糊”。模糊理论是为了解决真实世界中普遍存在的模糊现象而发展起来的一门学科,它是美国自动控制学家拉特飞扎德(LotfiA1Zadeh)于1965年首先提出的一种定量表达工具,用来表现某些无法明确定义的模糊性概念。模糊理论是以模糊集合为基础,其基本精神是接受模糊性现象存在的事实,而以处理概念模糊不确定的事物为其研究目标,并积极地将其严密量化成计算机可以处理的信息。实际上,模糊理论是模糊集合、模糊关系、模糊逻辑、模糊控制、模糊测量等理论的泛称,我们通常将之称为模糊数学。2模糊理论的基础一模糊集合和归属函数所谓集合是由一些具有某种共同特质事物汇总起来的组织,用来归纳一群具有相同特征事物。一般而言,传统意义上的集合具有下列共同的特点:①同一集合中的元素具有某种相同性质;②集合是元素组成的整体,元素之间可以互相区别;③集合里的元素是确定的。如果我们要给“偶数”这个集合下定义时,我们很明确的知道这个集合中的每个元素,对于任何给定的数值,我们都清楚的知道它是否属于这个集合。但是当我们为“中年人”这个集合下定义时,多少会遇到困难,因为具体的所谓中年,指的是几岁到几岁?相信每个人对中年的定义都是不同。假定从满35岁起到满55岁为止定义为中年,那么34岁的人还未迈入中年,只要增加一岁的那个瞬间就马上变成中年。另外,过完55岁迈入56岁生日的瞬间又已经不再是中年人。基本上,这是相当不合理的方式。前述“中年”定义之所以会不自然,是因其界线太过清楚所致,当界线缓和一些,则不自然当会消失。因此,如果以“中年的程度”来考虑或许会较适当。譬如说30岁的中年程度是016,35岁的中年程度是0165,随着不同年龄,其程度也徐徐变化,而此问题也就能获得根本上的解决。此种重新扩张定义的集合,由扎德教授提出,称之为模糊集合。也就是,把传统集合论特征函数从非0即1的二值选择,推广为可从0到1之间的任何值来做出选择,此新型的特征函数,称之为归属函数。归属函数是模糊理论中最基本的概念,而我们可第22卷第3期2004年3月情报科学Vol122,No13March,20041994-2009ChinaAcademicJournalElectronicPublishingHouse.Allrightsreserved.wwcnki以用归属函数来表示模糊集合:在域U上的模糊集合A,由归属函数uA(x)来表征,uA(x)在〔0,1〕区间中取值,uA(x)值的大小反映了元素x对于模糊集合A的归属程度。uA(x)的值越接近1,就表示元素x属于uA的程度越高。当uA=1就是上限,表示x完全属于uA。反之,若uA的值越接近0,就表示x属于uA的程度越低。当uA=0就是下限,表示x完全不属于uA。对于uA=015来说,距离“完全属于”与“完全不属于”最远,所以它的模糊度也最高。因此,模糊集合也被定义为元素与归属函数的组成集合。3模糊理论与信息检索自从模糊理论提出后,图书信息学界有一些学者尝试将之运用于图书信息学上。以下就模糊理论在信息检索的应用加以说明。(1)信息检索。所谓信息检...