下载次数:14次
价格:5.00元
电大之家提醒您:
请购买前,核对下面题目无误后再购买,电脑端按CTRL+F键进行核对题目,移动端通过顶部切换成“页内查”来核对题目;

( )是后续的数据转化、模型计算的必要前提。
A变量大小
B变量转换
C变量类别
D变量类型
根据数据分析的目的,需要确定每一行都是( )的实体。
A异质
B同质
C随意
D有结构
下列关于回归分析说法不正确的是( )。
A回归分析试图找出变量间确定的函数关系
B回归分析是用函数关系描述变量间关系的
C相关关系和回归分析不可以相互转化
D回归分析在数据挖掘中被广泛应用,可作为预测的方法
业务分析应该为明确的( )服务。
A企业目标
B计划
C组织目标
D战略目标
在现实世界中一些现象受到许多相互独立的随机因素的影响,如果每个因素所产生的影响都很微小,总的影响可以看作是服从( )的。
A正态分布
B卡方分布
Ct分布
DF分布
一般来说,如果样本容量越大,估计量会更接近总体参数。( )
A对
B错
一般来讲,训练集要包含所有可能的分类,这些分类的数目没有任何要求。( )
A对
B错
最近相邻算法中的邻居的远近是按照距离函数计算的。( )
A对
B错
业务分析主要特征是利用各种统计分析、优化等工具实现决策职能化。( )
A对
B错
数据可视化技术可以将所有数据的特性通过表的方式展示出来。( )
A对
B错
数据挖掘是从数据中自动地抽取模式、关联、变化、异常和有意义的结构。( )
A对
B错
数据集中的异常数据和重复数据都可能对建模的速度和精确度造成影响。( )
A对
B错
截尾均值的好处就是能减少极端值的影响,较平均值更能反映实际情况。( )
A对
B错
在前向型的神经网络中,每个输入字段都会对应一个输入神经元。( )
A对
B错
方差分析主要探讨给定量的变量与给定因素之间的关系。( )
A对
B错
交叉变量规则除了包括名称外,还包括( )。
A表达式
B函数
C公式
D代数式
如果同为无偏估计的两个统计量,一个比另外一个的估计量的方差小,就可以将方差( )的估计量称为有效估计量。
A大
B小
C相同
D随机
常用的数据调整方法有最大/最小转换和Z得分转换。( )
A对
B错
卡方分布是通用的变量间是相互关联的统计模型。( )
A对
B错
在数据挖掘中的一个预测算法中,输入数据太少,会大大影响数据挖掘的准确度。( )
A对
B错
对于每次抽样,所决定的统计量取值和总体参数的误差只能是正的。( )
A对
B错
构建贝叶斯网络过程需要经过构建有向无环图和计算图中有向边的条件概率表两个步骤。( )
A对
B错
最大间隔分类器是通过计算空间的离散点距超平面的距离,找到一个合适的超平面。( )
A对
B错
在决策管理中引入的优化问题,基本属于( )的问题。
A线性规划
B非线性规划
C整数规划
D动态规划
当一个项目集I的相对支持度满足预先指定的( )支持度阈值,项目集I就是一个频繁项目集。
A最大
B最小
C固定
D随机
测试是用( )的数据来验证具体的决策定义。
A批量
B少量
C随机
D固定规模
CARMA算法只需要对数据进行( )次扫描就可以获得比Apriori算法更低的支持度的结果。
A一
B两
C三
D四
Apriori算法的评估公式是基于( )来计算的。
A支持度
B相似度
C反对度
D置信度
Apriori算法中的发现频繁项目集步骤中,首先扫描数据,从中发现包含( )个项的项目集。
A1
B2
C3
D4
决策者在使用决策管理系统时,使用频度最高的是( )。
A测试
B场景分析
CWhat-If分析
D验证
下列关于CARMA算法步骤的算法中错误的是( )。
A在估计阶段的表格中记录项目集之间的关系
B在验证阶段,需要计算候选项目集的规模
C验证的第一步是将非频繁项目集从表格中删除
D验证阶段的删除方式和表格裁剪方式相同
优化的基本内容都来自于运筹,线性规划只是优化和运筹的一部分。( )
A对
B错
CARMA算法是一种为减少Apriori算法的I/O消耗及时间和空间辅助度的改进算法。( )
A对
B错
线性规划仅仅适用于优化和运筹问题。( )
A对
B错
系统不仅可以提供详细的信息,还能做出决策。( )
A对
B错
战略层级的决策由企业的高层做出,也就是说企业高层不应当参与操作层面的决策。( )
A对
B错
决策管理系统并不是要取代已有的业务流程系统,而是通过决策自动化来增强它。( )
A对
B错
提升度小于1时表明其中一个项集的出现降低了另一个项集出现的可能性。
A对
B错
Apriori算法使用标准的发现关联规则的步骤,先发现数据中的频繁项目集,然后从中产生关联规则。( )
A对
B错
决策管理系统是工作在战术层级的,是以战术层级制定决策为实现目标的。( )
A对
B错
下列关于最优解的判定标准说法正确的是( )。
A仅仅满足约束条件
B仅仅满足目标函数
C或者满足约束条件或者满足目标函数
D既满足约束条件又满足目标函数
多目标规划中,指( )是多个的。
A约束函数
B自变量
C因变量
D目标函数
在给定营销预算的限制下,如何选择合适的客户进行精准营销。这属于( )问题。
A线性规划
B0-1规划
C动态规划
D多目标规划
当提升度( )时,称为正相关规则。
A等于0
B等于1
C大于1
D小于1
既要花费少,又要收益大的问题属于( )问题。
A线性规划
B0-1规划
C动态规划
D多目标规划
从数据中发现关联规则的问题可以转变为发现频繁项目集。( )
A对
B错
越低的最小支持度阈值产生的关联规则数量越少。
A对
B错
当提升度小于1时表明其中一个项集的出现降低了另一个项集出现的可能性。( )
A对
B错
当目标函数和约束函数中至少有一个变量的函数是非线性规划时,就是非线性规划。( )
A对
B错
采样的时间间隔越短,数据的丢失就( )。
A越多
B越少
C越不确定
D没有影响
下列对于时间序列理解错误的是( )。
A大多数时间序列都是平稳的
B时间序列是通过定期测量时间段中某个变量获得的一组观察值
C公司每年的红利属于离散时间序列
D季节周期与序列的时间间隔相联系
两步聚类算法主要处理较大规模的数据,可自动确定类的数目,能处理连续变量和分类变量的混合数据。( )
A对
B错
聚类中同一个组内的数据对象的相似性较低。( )
A对
B错
通过BIRCH聚类算法处理过的数据需要进行离群值的处理。( )
A对
B错
如果将自回归模型和移动平均模型结合,就能得到一个既包含自回归又包含移动平均的更精确的时间序列分析方法。( )
A对
B错
聚类中相似或不相似是基于数据描述属性的取值来确定的。( )
A对
B错
简单移动平均法的各元素的权重要有所差别。( )
A对
B错
通常,用时间转换方法将季节性变化转换为( )。
A加法季节性变化
B减法季节性变化
C乘法积极性变化
D除法季节性变化
下列关于聚类的说法错误的是( )。
A聚类分析适合探讨样本间相互关联关系从而对一个样本结构做一个初步的评价
B聚类是一种监督的学习方法。
C聚类不依赖于事先确定的数据类别
D聚类是观察式学习
如果当前时间点的值需要通过前两个时间点值的回归加上随机误差来计算,则称之为二阶自回归AR(2)。( )
A对
B错
对于时间序列的测量值,既可以是连续数据也可以是离散数据。( )
A对
B错
贝叶斯网络的价值主要有( )。
A分类
B预测
C帮助了解因果关系
D有效避免数据过度拟合
下列关于支持向量机的理论正确的是( )。
A支持向量机的理论基础就是统计学习理论。
B根据统计学习理论,学习机器的实际风险由经验风险值和置信范围值两部分组成
C支持向量机在解决大样本、非线性机高维模式识别问题中表现出许多特有的优势
D线性分类器是支持向量机的基础
下列关于决策表的说法错误的有( )。
A决策表是指尝试从模型训练中发现一些规则
B决策树和决策表是完全不相同的,也完全不相似
C决策表的规则和记录是一一对应的
D决策表按照规则的顺序来决定规则的优先级
数据挖掘是从大量数据中寻找其规律的技术,是( )的综合。
A统计学
B计算机网络技术
C数据库技术
D人工智能技术
下列关于差异的说法正确的有( )。
A偶然因素引起的差异往往是比较显著的
B差异的绝对值大于给定的标准的概率分布区间称为拒绝区间
C事件属于接受区间则判断总体无显著差异
D事件属于拒绝区间,则认为总体有显著差异
假设检验的步骤是( )。
A提出假设
B规定显著性水平
C构造检验统计量
D做出拒绝或接受零建设的决策
一般来讲,统计量的标准有( )。
A无偏性
B有偏性
C一致性
D有效性
神经元网络的拓扑结构可以分为( )。
A前向型
B反馈型
C自组织竞争型
D随机型网络
下列选项中,属于实施决策管理要求的是( )。
A数据准备
B资深的业务人员
C数据分析师
DIT准备
下列选项中,属于优化问题的有( )。
A整数规划
B网络规划
C非光滑规划
D几何规划
根据决策的广义理解,把决策看作是( )过程。
A提出问题
B确立目标
C设计方案
D选择方案
CARMA算法在估计阶段,保存项目集信息的表格初始时,会按照( )步骤更新。
A增加统计量
B插入项目集
C裁剪表格
D删除表格
发现关联规则的步骤是( )。
A预选指定一个最小支持度计数阈值
B找到所有超过这个值的项目集
C从频繁项目集中产生强关联规则
D从频繁项目集中产生弱关联规则
下列选项中,关于整数规划说法正确的是( )。
A整数规划要求决策变量取整数值的数学规划
B若线性规划中的变量取整数值,则称之为整数线性规划
C在非线性规划中变量取整数值时,称之为整数非线性规划
D如果要求变量的取值只能是0和1,则是0-1规划
衡量关联规则强弱的指标主要有( )。
A支持度
B置信度
C相似度
D提升度
时间序列的特征主要有( )。
A趋势
B季节性周期性变化
C连续值
D离群值
利用时间散点图可以分析时间序列是否存在( )。
A趋势
B季节性变化
C离群值
D缺失值
通过霍尔特指数平滑法可以处理( )的趋势。
A随机
B固定
C非线性
D线性
下列关于K均值算法理解正确的有( )。
AK均值聚类算法是高效的,但是比较缓慢
BK均值算法使簇内对象具有较高的相似度
CK均值算法使簇间的相似度较低
DK均值聚类算法的相似度的计算是根据一个簇中对象的平均值进行的
两步聚类算法的步骤为( )。
A预聚类
B归一化处理
C离散值处理
D聚类
下列选项中列出的聚类算法能很好处理大批量数据的有( )。
ABIRCH聚类算法
B分层聚类算法
C两步聚类算法
DK均值聚类算法
决定选择何种时间序列分析法的原则包括( )。
A要解决的问题
B目的
C时间
D时间序列数据的特点
K均值聚类算法的输入包括( )。
A聚类个数K
B初始中心
Cn个数据对象
D方差
考察聚类内的特征主要有( )。
A标准差
B聚类半径
CSSE
DSSB
BIRCH聚类算法在决定将某个记录划归到某个树上的节点时,会考虑该记录的( )特征。
A变量的均值
B变量的标准差
C变量的方差
D变量每个分类的个数
同指数平滑法相比,自回归模型具有( )。
A灵活性
B通用性
C可靠性
D适用性