单选题
1什么是KDD?()
A领域知识发现
B文档知识发现
C动态知识发现
D数据挖掘与知识发现
答案:D
2假设有学生考试成绩的值:60,45,33,77,80,100,100,90,70,65,找出这组数据的中列数( )。
A100
B66.5
C 82.5
D 78
答案:B
3某超市研究销售记录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?()
A聚类
B分类
C关联规则发现
D自然语言处理
答案:C
4属于定量的属性类型是()。
A序数
B标称
C相异
D区间
答案:D
5只有非零值才重要的二元属性被称作()。
A对称属性
B计数属性
C离散属性
D非对称的二元属性
答案:D
6 考虑值集{1、2、3、4、5、90},其截断均值(p=20%)是()。
A3
B5
C3.5
D2
答案:
7假设12个销售价格记录已经排序如下:5,10,11,13,15,35,50,55,72,92,204,215使用如下每种方法将它们划分成四个箱。等频(等深)划分时,15在第几个箱子内?()
A第四个
B第一个
C第三个
D第二个
答案:
8以下两种描述分别对应哪两种对分类算法的评价标准?()
(a)警察抓小偷,描述警察抓的人中有多少个是小偷的标准。
(b)描述有多少比例的小偷给警察抓了的标准。
ARecall,ROC
BPrecision,ROC
CRecall,Precision
DPrecision,Recall
答案:
9使用交互式的和可视化的技术,对数据进行探索属于数据挖掘的哪一类任务?()
A 探索性数据分析
B预测建模
C寻找模式和规则
D建模描述
答案:
10下列不属于分析与挖掘的数据类型的是()。
A数据库数据
B数据矩阵
C事务数据
D数据分析
答案:
11下面哪种不属于数据预处理的方法?()
A离散化
B估计遗漏值
C变量代换
D聚集
答案:
12建立一个模型,通过这个模型根据已知的变量值,来预测其他某个变量值属于数据挖掘的哪一类任务?()
A根据内容检索
B建模描述
C预测建模
D寻找模式和规则
答案:
13用户有一种感兴趣的模式并且希望在数据集中找到相似的模式,属于数据挖掘哪一类任务?()
A寻找模式和规则
B预测建模
C根据内容检索
D建模描述
答案:
14将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务?()
A数据预处理
B频繁模式挖掘
C数据流挖掘
D分类和预测
答案:
16假设有学生考试成绩的值:60,45,33,77,80,100,100,90,70,65,找出这组数据的中位数( )。
A100
B 78.5
C55
D73.5
答案:
17下面哪个不属于数据的属性类型。()
A相异
B区间
C序数
D标称
答案:
18数值属性的相异性不包括( )。
A牛顿距离
B闵可夫斯基距离
C切比雪夫距离
D欧几里得距离
答案:
19目前数据分析和数据挖掘面临的挑战性问题不包括()。
A离散点数据
B数据分析与数据挖掘结果的可视化
C高维度数据
D数据类型的多样性
答案:
20目的是缩小数据的取值范围,使其更适合于数据挖掘算法的需要,并且能够得到和原始数据相同的分析结果的是()。
A数据归约
B数据清洗
C数据集成
D 数据变换
答案:
21下面不属于创建新属性的相关方法的是()。
A映射数据到新的空间
B特征修改
C特征构造
D特征提取
答案:
22以下哪种方法不属于特征选择的标准方法()。
A过滤
B抽样
C包装
D嵌入
答案:
23当不知道数据所带标签时,可以使用哪种技术促使带同类标签的数据与带其他标签的数据相分离?()
A隐马尔科夫链
B聚类
C分类
D关联分析
答案:
24下列的类型,哪一个不属于属性的分类( )。
A二元属性
B数值属性
C 标称属性
D集合属性
答案:
25为数据的总体分布建模,把多维空间划分成组等问题,属于数据挖掘的哪一类任务?()
A预测建模
B探索性数据分析
C寻找模式和规则
D建模描述
答案:
26 假设12个销售价格记录已经排序如下:5,10,11,13,15,35,50,55,72,92,204,215使用如下每种方法将它们划分成四个箱。等宽划分时(宽度为50),15又在哪个箱子里?()
A 第三个
B 第二个
C 第一个
D 第四个
答案:
多选题
1基本统计图形显示有()
A饼图
B散点图
C频率直方图
D 箱图
答案:
2数据分散度量有()
A分位数
B极差
C方差
D四分位数
E标准差
答案:
3分析与挖掘的数据类型有()
A数据库数据
B数据矩阵
C图和网状数据
D数据仓库数据
E其它类型的数据
F事务数据
答案:
填空题
1数据预处理的方法包括、、、。
答案:
2数据分析与数据挖掘的方法有、、、。
答案:
简答题
1简述均值、中位数、众数和中列数的定义。
答案:
2阐述二元属性的状态以及每种状态表示的含义。
答案:
3数据预处理的主要方法有哪些?每个方法的主要内容是什么?
答案:
4什么是极差、分位数、方差?
答案:
5什么是数据分析和数据挖掘?简单论述他们之间的区别和联系。
答案: