毕业论文

打赏
当前位置: 毕业论文 > 电子通信 >

基于关联规则算法的处方信息分析研究(3)

时间:2018-06-12 20:37来源:毕业论文
具体来表述,整个挖掘过程包含下面几个步骤(如图2.1所示): 图2.1 数据挖掘过程的步骤 1)数据集成:保证数据一定要大量且全面丰富,只有这样才能


具体来表述,整个挖掘过程包含下面几个步骤(如图2.1所示):
数据挖掘过程的步骤
 图2.1 数据挖掘过程的步骤
1)数据集成:保证数据一定要大量且全面丰富,只有这样才能更具有说服性。数据过于少,整个数据挖掘过程肯定毫无作用。
2)数据过滤:数据过滤是对整个数据集合就行清洗,消除噪声和一些格式等不一样的数据,避免其对挖掘结果产生影响。通过这一步骤,可以得到更加准确、更加丰富的数据,从而保障挖掘过程的顺利进行。
3)数据选择:在数据库中提取符合要求的相关数据
4)数据转换:将一些形式不符合的数据进行相应的转换得到符合要求的数据
5)数据挖掘:使用适当的数据挖掘方法进行挖掘
6)评估:判断数据挖掘结果是否合理,是否有实际意义。评估也可以依据丰富的经验,用数据来验证模型是否正确,进而调整整个模型,再反复进行挖掘。
7)结果表示:把数据之间的特性、数据之间的关系形象具体化的描述。
2.2.3  数据挖掘的分类
数据挖掘有多种分类方式,可以根据发现的知识类型、采用的技术类型、数据库的类型、挖掘的深度以及挖掘的应用领域来进行分类。
这里主要介绍一下按照被发现知识类型分类:
1)    关联规则挖掘:数据挖掘中最先研究的挖掘方法之一。在实践中也比较成熟,挖掘目的也从最初的发现项集之间的关联关系扩展为不同类型的关联关系。
2)    特征规则挖掘:从相关的一组数据之中提取表达式,用这些表达式去描述整个数据集合的特征。
3)    分类规则挖掘:通过分析数据的样本,得出有关类别的较为准确的描述。
4)    时序规则挖掘:也称为序列模式,是生成与时间有关的规则。
5)    偏差规则挖掘:偏差包括分类中的反常实例、例外模式、观测结果对期望值的偏离及量值随时间的变化等。
    按挖掘数据库类型分类分为面对对象、事务数据库及多媒体数据库等等,其余几种分类标准也有相对应的分类,就不一一列出。 基于关联规则算法的处方信息分析研究(3):http://www.751com.cn/tongxin/lunwen_17521.html
------分隔线----------------------------
推荐内容