单选题
1下列哪一个选项是数据立方体中的基本方体的概念( )。
A不同层创建的数据立方体
B最低抽象层创建的立方体
C每一个数据立方体
D最高层抽象的立方体
答案:B
2频繁项集、频繁闭项集、最大频繁项集之间的关系是( )
A频繁项集 = 频繁闭项集 = 最大频繁项集
B频繁项集 = 频繁闭项集 最大频繁项集
C频繁项集 频繁闭项集 最大频繁项集
D频繁项集 频繁闭项集 =最大频繁项集
答案:C
3考虑值集{12 24 33 2 4 55 68 26},其四分位数极差是( )。
A3
B24
C55
D31
答案:D
4下面( )属于映射数据到新的空间的方法。
A傅里叶变换
B特征加权
C维归约
D渐进抽样
答案:A
5 关于基本数据的元数据是指( )。
A基本元数据包括与企业相关的管理方面的数据和信息
B基本元数据与数据源,数据仓库,数据集市和应用程序等结构相关的信息
C基本元数据包括关于装载和更新处理,分析处理以及管理方面的信息
D基本元数据包括日志文件和简历执行处理的时序调度信息
答案:B
6 下面关于数据粒度的描述不正确的是( )。
A数据越详细,粒度就越小,级别也就越高
B粒度的具体划分将直接影响数据仓库中的数据量以及查询质量
C粒度是指数据仓库小数据单元的详细程度和级别
D数据综合度越高,粒度也就越大,级别也就越高
答案:
7OLAP技术的核心是( )。
A多维分析
B 对用户的快速响应
C在线性
D 互操作性
答案:
8有关数据仓库的开发特点,不正确的描述是( )。
A在数据仓库环境中,并不存在操作型环境中所固定的和较确切的处理流,数据仓库中数据分析和处理更灵活,且没有固定的模式
B数据仓库开发要从数据出发
C 数据仓库使用的需求在开发出去就要明确
D数据仓库的开发是一个不断循环的过程,是启发式的开发
答案:
9 关于OLAP和OLTP的说法,下列不正确的是( )。
AOLTP以应用为核心,是应用驱动的
BOLAP的最终数据来源与OLTP不一样
COLTP面对的是决策人员和高层管理人员
DOLAP事务量大,但事务内容比较简单且重复率高
答案:
10关于OLAP的特性,下面正确的是 ( )。
(1)快速性 (2)可分析性 (3)多维性 (4)信息性 (5)共享性
A(2) (3) (4)
B(1) (2) (3) (4) (5)
C (1) (2) (3) (4)
D(1) (2) (3)
答案:
11下列哪个不是专门用于可视化时间空间数据的技术:( )
A矢量场图
B曲面图
C饼图
D等高线图
答案:
12设X={1,2,3}是频繁项集,则可由X产生( )个关联规则。
A4
B6
C7
D5
答案:
13数据仓库的三层体系结构不包括( )。
A数据仓库服务器
BSMTP服务器
C OLAP服务器
D前端工具
答案:
14 下列哪一项不是数据规范化的常用方法( )。
A最小-最大值规范化
B按整数定标规范法
C按小数定标规范化
D z-score规范化
答案:
15在图集合中发现一组公共子结构,这样的任务称为( )。
A频繁子集挖掘
B频繁模式挖掘
C频繁数据项挖掘
D频繁子图挖掘
答案:
16熵是为消除不确定性所需要获得的信息量,投掷均匀正六面体骰子的熵是( )。
A1比特
B 3.2比特
C2.6比特
D3.8比特
答案:
17假设属性income的最大最小值分别是12000元和98000元。利用最大最小规范化的方法将属性的值映射到0至1的范围内。对属性income的73600元将被转化为( )。
A0.716
B0.821
C1.224
D1.458
答案:
18数据仓库设计的三级数据模型不包括( )。
A 数据模型
B概念模型
C逻辑模型
D物理模型
答案:
19假定用于分析的数据包含属性age。数据元组中age的值如下(按递增序):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70, 问题:使用按箱平均值平滑方法对上述数据进行平滑,箱的深度为3。第二个箱子值为( )。
A26.8
B27.9
C18.3
D 22.6
答案:
20考虑下面的频繁3-项集的集合:{1,2,3},{1,2,4},{1,2,5},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5}假定数据集中只有5个项,采用合并策略,由候选产生过程得到4-项集不包含( )。
A 1,2,3,4
B 1,2,3,5
C 1,3,4,5
D 1,2,4,5
答案:
21 一所大学内的各年纪人数分别为:一年级200人,二年级160人,三年级130人,四年级110人。则年级属性的众数是( )。
A四年级
B 一年级
C二年级
D三年级
答案:
22关于OLAP和OLTP的区别描述,不正确的是( )。
A OLAP的特点在于事务量大,但事务内容比较简单且重复率高
B OLAP主要是关于如何理解聚集的大量不同的数据.它与OTAP应用程序不同
C与OLAP应用程序不同,OLTP应用程序包含大量相对简单的事务
D OLAP是以数据仓库为基础的,但其最终数据来源与OLTP一样均来自底层的数据库系统,两者面对的用户是相同的
答案:
23在有关数据仓库测试,下列说法不正确的是 ( )。
A系统的集成测试需要对数据仓库的所有组件进行大量的功能测试和回归测试
B在测试之前没必要制定详细的测试计划
C当数据仓库的每个单独组件完成后,就需要对他们进行单元测试
D在完成数据仓库的实施过程中,需要对数据仓库进行各种测试.测试工作中要包括单元测试和系统测试.
答案:
24下列哪一项不是数据仓库的关键性质( )。
A集成性
B与时间相关
C与空间相关
D面向主题
答案:
25在抽样方法中,当合适的样本容量很难确定时,可以使用的抽样方法是( )。
A有放回的简单随机抽样
B分层抽样
C无放回的简单随机抽样
D渐进抽样
答案:
26数据仓库是随着时间变化的,下面的描述不正确的是( )。
A数据仓库随事件变化不断删去旧的数据内容
B捕捉到的新数据会覆盖原来的快照
C 数据仓库中包含大量的综合数据,这些综合数据会随着时间的变化不断地进行重新综合
D数据仓库随时间的变化不断增加新的数据内容
答案:
27 未来房价的预测,这种属于数据挖掘的哪类问题( )。
A分类
B聚类
C回归分析
D关联规则
答案:
28 将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务()。
A分类和预测
B频繁模式挖掘
C数据预处理
D数据流挖掘
答案:
29OLAM技术一般简称为”数据联机分析挖掘”,下面说法正确的是 ( )。
A由于OLAM的立方体和用于OLAP的立方体有本质的区别
B基于WEB的OLAM是WEB技术与OLAM技术的结合
C OLAM服务器通过用户图形借口接收用户的分析指令,在元数据的知道下,对超级立方体作一定的操作
D OLAP和OLAM都基于客户机/服务器模式,只有后者有与用户的交互性
答案:
30概念分层图是( )图。
A无向无环
B无向有环
C 有向无环
D有向有环
答案:
填空题
1多维数据模型主要分为 。
答案:
2变量之间的关系可分为
答案:
3相关性分析有
答案:
4项集包含 或_ 项的集合
答案:
5回归分析的步骤 。
答案:
简答题
1变量间的确定性关系和非确定性关系分别指的是什么?
答案:
2简述数据仓库概念模型与逻辑模型的设计步骤。
答案:
3【案例分析题】
某公司存储员工信息的数据库中表示收入的字段income排序后的值(元)为:900,1000,1300,1600,1600,1900,2000,2400,2600,2900,3000,3600,4000,4600,4900,5000。
1. 按照等深分箱法进行分箱。
2. 按照等宽分箱法进行分箱。
答案: