数据挖掘分析方法可以划分为关联分析、序列模式分析、分类分析和聚类分析四种。如果需要一个示例库(该库中每个元组都有一个给定类标识)做训练集时,这种分析方法属于( )。
- A.关联分析
- B.序列模式分析
- C.分类分析
- D.聚类分析
正确答案及解析
正确答案
解析
本题考查数据挖掘基础知识。数据挖掘就是应用一系列技术从大型数据库或数据仓库中提取人们感兴趣信息和知识,这些知识或信息是隐含,事先未知而潜在有用,提取知识表示为概念、规则、规律、模式等形式。也可以说,数据挖掘是一类深层次数据分析。无论采用哪种技术完成数据挖掘,从功能上可以将数据挖掘分析方法划分为四种即关联分析、序列模式分析、分类分析和聚类分析。①关联分析(Associations):目是为了挖掘出隐藏在数据间相互关系。若设R={A1,A2,...,AP}为{0,1}域上属性集,r为R上一个关系,关于r关联规则表示为X→B,其中X∈R,B∈R,且X∩B=¤。关联规则矩阵形式为:矩阵r中,如果在行X每一列为1,则行B中各列趋向于为1。在进行关联分析同时还需要计算两个参数,最小置信度(Confidence)和最小支持度(Support)。前者用以过滤掉可能性过小规则,后者则用来表示这种规则发生概率,即可信度。②序列模式分析(Sequential Patterns):目也是为了挖掘出数据之间联系,但它侧重点在于分析数据间前后关系(因果关系)。例如,将序列模式分析运用于商业,经过分析,商家可以根据分析结果发现客户潜在购物模式,发现顾客在购买一种商品同时经常购买另一种商品可能性。在进行序列模式分析时也应计算置信度和支持度。③分类分析(Classifiers):首先为每一个记录赋予一个标记(一组具有不同特征类别),即按标记分类记录,然后检查这些标定记录,描述出这些记录特征。这些描述可能是显式,如一组规则定义;也可能是隐式,如一个数学模型或公式。④聚类分析(Clustering):聚类分析法是分类分析法逆过程,它输入集是一组未标定记录,即输入记录没有作任何处理。目是根据一定规则,合理地划分记录集合,并用显式或隐式方法描述不同类别。在实际应用DM系统中,上述四种分析方法有着不同适用范围,因此经常被综合运用。
你可能感兴趣的试题

-
- A.V(S2)和P(S4)
- B.P(S2)和V(S4)
- C.P(S2)和P(S4)
- D.V(S2)和V(S4)
- 查看答案

-
- A.V(S1)P(S2)和V(S3)
- B.P(S1)V(S2)和V(S3)
- C.V(S1)V(S2)和V(S3)
- D.P(S1)P(S2)和V(S3)
- 查看答案

-
- A.P(S4)和V(S4)V(S5)
- B.V(S5)和P(S4)P(S5)
- C.V(S3)和V(S4)V(S5)
- D.P(S3)和P(S4)V(P5)
- 查看答案

-
- A.P(S3)和V(S4)V(S5)
- B.V(S3)和P(S4)P(S5)
- C.P(S3)和P(S4)P(S5)
- D.V(S3)和V(S4)V(S5)
- 查看答案

-
- A.P(S2)和P(S4)
- B.P(S2)和V(S4)
- C.V(S2)和P(S4)
- D.V(S2)和V(S4)
- 查看答案