江苏开放大学2024年春《数据挖掘技术 060734》第1次形考作业参考答案

2024年3月2608:59:30发布者:国开文档专家 51 views 举报

单选题

1什么是KDD?(

A领域知识发现

B文档知识发现

C动态知识发现

D数据挖掘与知识发现

答案:D

2假设有学生考试成绩的值:6045337780100100907065,找出这组数据的中列数( )。

A100     

B66.5

C 82.5 

D 78

答案:B

3某超市研究销售记录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?(

A聚类

B分类

C关联规则发现

D自然语言处理

答案:C

4属于定量的属性类型是()。

A序数

B标称

C相异

D区间

答案:D

5只有非零值才重要的二元属性被称作()。

A对称属性

B计数属性

C离散属性

D非对称的二元属性

答案:D

考虑值集{1234590},其截断均值(p=20%)是()。

A3

B5

C3.5

D2

答案:

7假设12个销售价格记录已经排序如下:5101113153550557292204215使用如下每种方法将它们划分成四个箱。等频(等深)划分时,15在第几个箱子内?(

A第四个

B第一个

C第三个

D第二个

答案:

8以下两种描述分别对应哪两种对分类算法的评价标准?(

a)警察抓小偷,描述警察抓的人中有多少个是小偷的标准。

b)描述有多少比例的小偷给警察抓了的标准。

ARecallROC

BPrecisionROC

CRecallPrecision

DPrecisionRecall

答案:

9使用交互式的和可视化的技术,对数据进行探索属于数据挖掘的哪一类任务?(

探索性数据分析

B预测建模

C寻找模式和规则

D建模描述

答案:

10下列不属于分析与挖掘的数据类型的是()。

A数据库数据

B数据矩阵

C事务数据

D数据分析

答案:

11下面哪种不属于数据预处理的方法?(

A离散化

B估计遗漏值

C变量代换

D聚集

答案:

12建立一个模型,通过这个模型根据已知的变量值,来预测其他某个变量值属于数据挖掘的哪一类任务?(

A根据内容检索

B建模描述

C预测建模

D寻找模式和规则

答案:

13用户有一种感兴趣的模式并且希望在数据集中找到相似的模式,属于数据挖掘哪一类任务?(

A寻找模式和规则

B预测建模

C根据内容检索

D建模描述

答案:

14将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务?(

A数据预处理

B频繁模式挖掘

C数据流挖掘

D分类和预测

答案:

16假设有学生考试成绩的值:6045337780100100907065,找出这组数据的中位数( )。

A100

B 78.5 

C55

D73.5

答案:

17下面哪个不属于数据的属性类型。(

A相异

B区间

C序数

D标称

答案:

18数值属性的相异性不包括( )。

A牛顿距离

B闵可夫斯基距离

C切比雪夫距离

D欧几里得距离

答案:

19目前数据分析和数据挖掘面临的挑战性问题不包括()。

A离散点数据

B数据分析与数据挖掘结果的可视化

C高维度数据

D数据类型的多样性

答案:

20目的是缩小数据的取值范围,使其更适合于数据挖掘算法的需要,并且能够得到和原始数据相同的分析结果的是()。

A数据归约

B数据清洗

C数据集成

数据变换

答案:

21下面不属于创建新属性的相关方法的是()。

A映射数据到新的空间

B特征修改

C特征构造

D特征提取

答案:

22以下哪种方法不属于特征选择的标准方法()。

A过滤

B抽样

C包装

D嵌入

答案:

23当不知道数据所带标签时,可以使用哪种技术促使带同类标签的数据与带其他标签的数据相分离?(

A隐马尔科夫链

B聚类

C分类

D关联分析

答案:

24下列的类型,哪一个不属于属性的分类( )。

A二元属性

B数值属性

标称属性

D集合属性

答案:

25为数据的总体分布建模,把多维空间划分成组等问题,属于数据挖掘的哪一类任务?(

A预测建模

B探索性数据分析

C寻找模式和规则

D建模描述

答案:

26 假设12个销售价格记录已经排序如下:5101113153550557292204215使用如下每种方法将它们划分成四个箱。等宽划分时(宽度为50),15又在哪个箱子里?(

第三个

第二个

第一个

第四个

答案:

多选题

1基本统计图形显示有()

A饼图

B散点图

C频率直方图

箱图

答案: 

2数据分散度量有()

A分位数

B极差

C方差

D四分位数

E标准差

答案: 

3分析与挖掘的数据类型有()

A数据库数据

B数据矩阵

C图和网状数据

D数据仓库数据

E其它类型的数据

F事务数据

答案: 

填空题

1数据预处理的方法包括、、、

答案: 

2数据分析与数据挖掘的方法有、、

答案: 

简答题

1简述均值、中位数、众数和中列数的定义。

答案:

 

2阐述二元属性的状态以及每种状态表示的含义。

答案:

 

3数据预处理的主要方法有哪些?每个方法的主要内容是什么?

答案:

 

4什么是极差、分位数、方差?

答案:

 

5什么是数据分析和数据挖掘?简单论述他们之间的区别和联系。

答案:

 

提示:下载前请核对题目。客服微信:diandahome
下载的文档都包含参考答案
特别声明:以上内容(如有图片或文件亦包括在内)为“电大之家”用户上传并发布,仅代表该用户观点,本平台仅提供信息发布。