江苏开放大学2024年春《数据挖掘技术 060734》第2次形考作业参考答案

2024年4月2517:32:26发布者:国开文档专家 33 views 举报

单选题

1下列哪一个选项是数据立方体中的基本方体的概念( )。

A不同层创建的数据立方体

B最低抽象层创建的立方体 

C每一个数据立方体

D最高层抽象的立方体

答案:B

2频繁项集、频繁闭项集、最大频繁项集之间的关系是(  )

A频繁项集 = 频繁闭项集 = 最大频繁项集

B频繁项集 = 频繁闭项集 最大频繁项集

C频繁项集 频繁闭项集 最大频繁项集

D频繁项集 频繁闭项集 =最大频繁项集

答案:C

3考虑值集{12 24 33 2 4 55 68 26},其四分位数极差是(  )。

A3

B24

C55

D31

答案:D

4下面(  )属于映射数据到新的空间的方法。

A傅里叶变换

B特征加权

C维归约

D渐进抽样

答案:A

5 关于基本数据的元数据是指(  )。

A基本元数据包括与企业相关的管理方面的数据和信息

B基本元数据与数据源,数据仓库,数据集市和应用程序等结构相关的信息

C基本元数据包括关于装载和更新处理,分析处理以及管理方面的信息

D基本元数据包括日志文件和简历执行处理的时序调度信息

答案:B

6 下面关于数据粒度的描述不正确的是(  )。

A数据越详细,粒度就越小,级别也就越高

B粒度的具体划分将直接影响数据仓库中的数据量以及查询质量

C粒度是指数据仓库小数据单元的详细程度和级别

D数据综合度越高,粒度也就越大,级别也就越高

答案:

7OLAP技术的核心是(  )。

A多维分析

B 对用户的快速响应

C在线性

D 互操作性

答案:

8有关数据仓库的开发特点,不正确的描述是(  )。

A在数据仓库环境中,并不存在操作型环境中所固定的和较确切的处理流,数据仓库中数据分析和处理更灵活,且没有固定的模式

B数据仓库开发要从数据出发

C 数据仓库使用的需求在开发出去就要明确

D数据仓库的开发是一个不断循环的过程,是启发式的开发

答案:

9 关于OLAP和OLTP的说法,下列不正确的是(  )。

AOLTP以应用为核心,是应用驱动的

BOLAP的最终数据来源与OLTP不一样

COLTP面对的是决策人员和高层管理人员

DOLAP事务量大,但事务内容比较简单且重复率高

答案:

10关于OLAP的特性,下面正确的是 (  )。

(1)快速性 (2)可分析性 (3)多维性 (4)信息性 (5)共享性

A(2) (3) (4)

B(1) (2) (3) (4) (5)

C (1) (2) (3) (4)

D(1) (2) (3)

答案:

11下列哪个不是专门用于可视化时间空间数据的技术:(  )

A矢量场图

B曲面图

C饼图

D等高线图

答案:

12设X={1,2,3}是频繁项集,则可由X产生(  )个关联规则。

A4

B6

C7

D5

答案:

13数据仓库的三层体系结构不包括( )。

A数据仓库服务器

BSMTP服务器

C OLAP服务器

D前端工具

答案:

14 下列哪一项不是数据规范化的常用方法( )。

A最小-最大值规范化

B按整数定标规范法

C按小数定标规范化

D z-score规范化

答案:

15在图集合中发现一组公共子结构,这样的任务称为(  )。

A频繁子集挖掘

B频繁模式挖掘

C频繁数据项挖掘

D频繁子图挖掘

答案:

16熵是为消除不确定性所需要获得的信息量,投掷均匀正六面体骰子的熵是(  )。

A1比特

B 3.2比特

C2.6比特

D3.8比特

答案:

17假设属性income的最大最小值分别是12000元和98000元。利用最大最小规范化的方法将属性的值映射到0至1的范围内。对属性income的73600元将被转化为(  )。

A0.716

B0.821

C1.224

D1.458

答案:

18数据仓库设计的三级数据模型不包括( )。

A 数据模型

B概念模型

C逻辑模型

D物理模型

答案:

19假定用于分析的数据包含属性age。数据元组中age的值如下(按递增序):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70, 问题:使用按箱平均值平滑方法对上述数据进行平滑,箱的深度为3。第二个箱子值为(  )。

A26.8

B27.9

C18.3

D 22.6

答案:

20考虑下面的频繁3-项集的集合:{1,2,3},{1,2,4},{1,2,5},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5}假定数据集中只有5个项,采用合并策略,由候选产生过程得到4-项集不包含(  )。

A 1,2,3,4

B 1,2,3,5

C 1,3,4,5

D 1,2,4,5

答案:

21 一所大学内的各年纪人数分别为:一年级200人,二年级160人,三年级130人,四年级110人。则年级属性的众数是(  )。

A四年级

B 一年级

C二年级

D三年级

答案:

22关于OLAP和OLTP的区别描述,不正确的是(  )。

A OLAP的特点在于事务量大,但事务内容比较简单且重复率高

B OLAP主要是关于如何理解聚集的大量不同的数据.它与OTAP应用程序不同

C与OLAP应用程序不同,OLTP应用程序包含大量相对简单的事务

D OLAP是以数据仓库为基础的,但其最终数据来源与OLTP一样均来自底层的数据库系统,两者面对的用户是相同的

答案:

23在有关数据仓库测试,下列说法不正确的是 (  )。

A系统的集成测试需要对数据仓库的所有组件进行大量的功能测试和回归测试

B在测试之前没必要制定详细的测试计划

C当数据仓库的每个单独组件完成后,就需要对他们进行单元测试

D在完成数据仓库的实施过程中,需要对数据仓库进行各种测试.测试工作中要包括单元测试和系统测试.

答案:

24下列哪一项不是数据仓库的关键性质( )。

A集成性

B与时间相关

C与空间相关

D面向主题

答案:

25在抽样方法中,当合适的样本容量很难确定时,可以使用的抽样方法是(  )。

A有放回的简单随机抽样

B分层抽样

C无放回的简单随机抽样

D渐进抽样

答案:

26数据仓库是随着时间变化的,下面的描述不正确的是(  )。

A数据仓库随事件变化不断删去旧的数据内容

B捕捉到的新数据会覆盖原来的快照

C 数据仓库中包含大量的综合数据,这些综合数据会随着时间的变化不断地进行重新综合

D数据仓库随时间的变化不断增加新的数据内容

答案:

27 未来房价的预测,这种属于数据挖掘的哪类问题(  )。

A分类

B聚类

C回归分析

D关联规则

答案:

28 将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务()。

A分类和预测

B频繁模式挖掘

C数据预处理  

D数据流挖掘

答案:

29OLAM技术一般简称为”数据联机分析挖掘”,下面说法正确的是 (  )。

A由于OLAM的立方体和用于OLAP的立方体有本质的区别

B基于WEB的OLAM是WEB技术与OLAM技术的结合

C OLAM服务器通过用户图形借口接收用户的分析指令,在元数据的知道下,对超级立方体作一定的操作

D OLAP和OLAM都基于客户机/服务器模式,只有后者有与用户的交互性

答案:

30概念分层图是(  )图。

A无向无环

B无向有环

C 有向无环

D有向有环

答案:

填空题

1多维数据模型主要分为   。

答案:

2变量之间的关系可分为 

答案:

3相关性分析有    

答案:

4项集包含 或_ 项的集合

答案:

5回归分析的步骤     。

答案:

简答题

1变量间的确定性关系和非确定性关系分别指的是什么?

答案:


2简述数据仓库概念模型与逻辑模型的设计步骤。

答案:


3【案例分析题】

某公司存储员工信息的数据库中表示收入的字段income排序后的值(元)为:900,1000,1300,1600,1600,1900,2000,2400,2600,2900,3000,3600,4000,4600,4900,5000。

1. 按照等深分箱法进行分箱。

2. 按照等宽分箱法进行分箱。

答案:


提示:下载前请核对题目。客服微信:diandahome
下载的文档都包含参考答案
特别声明:以上内容(如有图片或文件亦包括在内)为“电大之家”用户上传并发布,仅代表该用户观点,本平台仅提供信息发布。