【关键词】 定性数据分析; 粗糙集; 流向图;
【中文摘要】 定性数据分析方法有着广泛的应用前景,但随着数据采集和存储技术的进步,我们开始面对日益增多的庞大数据库,由于“总体漂移”及非独立同分布数据的出现,现有定性数据分析方法急待发展与完善。粗糙集作为一种处理离散数据的数学工具,为定性数据分析方法的创新提供了一种新的视角。通过深入研究定性数据分析内容和粗糙集方法,本文从理论与应用两个方面较为全面和系统地提出了基于粗糙集的定性数据分析方法,主要探讨了粗糙集在数据描述、数据预处理、判别分析及聚类分析等方面的应用。 本文创新之处:1.应用粗糙集从数据归纳推理的角度进行定性数据分析方法的研究,这使得分析方法除了数据本身之外不需要任何其他的信息,由推断到推理是方法上的根本转变。2.提出了用分类信息表S={U/R,A,V,F}描述定性数据的方法,将变量之间关系的分析转换为变量等价类之间关系的分析。提出了用关联信息系数IR(X_i,X_j)描述变量间关联关系的方法,克服了采用χ~2检验方法的不足。3.提出了基于信息熵进行变量约简的方法和对数据的关联结构进行压缩的方法。4.在引入粗糙集流向图的同时,提出了按照变量的重要性确定流向图层次的方法,避免了分析中由于流向图层次选择不当而...