奥鹏东北财经大学《数据分析与决策》单元作业一二三答案在线作业答案

2022年5月821:33:11发布者:国开文档专家 1,645 views 举报

( )是后续的数据转化、模型计算的必要前提。

 A变量大小

 B变量转换

 C变量类别

 D变量类型

根据数据分析的目的,需要确定每一行都是( )的实体。

 A异质

 B同质

 C随意

 D有结构

下列关于回归分析说法不正确的是( )。

 A回归分析试图找出变量间确定的函数关系

 B回归分析是用函数关系描述变量间关系的

 C相关关系和回归分析不可以相互转化

 D回归分析在数据挖掘中被广泛应用,可作为预测的方法

业务分析应该为明确的( )服务。

 A企业目标

 B计划

 C组织目标

 D战略目标

在现实世界中一些现象受到许多相互独立的随机因素的影响,如果每个因素所产生的影响都很微小,总的影响可以看作是服从( )的。

 A正态分布

 B卡方分布

 Ct分布

 DF分布

一般来说,如果样本容量越大,估计量会更接近总体参数。( )

 A对

 B错

一般来讲,训练集要包含所有可能的分类,这些分类的数目没有任何要求。( )

 A对

 B错

最近相邻算法中的邻居的远近是按照距离函数计算的。( )

 A对

 B错

业务分析主要特征是利用各种统计分析、优化等工具实现决策职能化。( )

 A对

 B错

数据可视化技术可以将所有数据的特性通过表的方式展示出来。( )

 A对

 B错

数据挖掘是从数据中自动地抽取模式、关联、变化、异常和有意义的结构。( )

 A对

 B错

数据集中的异常数据和重复数据都可能对建模的速度和精确度造成影响。( )

 A对

 B错

截尾均值的好处就是能减少极端值的影响,较平均值更能反映实际情况。( )

 A对

 B错

在前向型的神经网络中,每个输入字段都会对应一个输入神经元。( )

 A对

 B错

方差分析主要探讨给定量的变量与给定因素之间的关系。( )

 A对

 B错

交叉变量规则除了包括名称外,还包括( )。

 A表达式

 B函数

 C公式

 D代数式

如果同为无偏估计的两个统计量,一个比另外一个的估计量的方差小,就可以将方差( )的估计量称为有效估计量。

 A大

 B小

 C相同

 D随机

常用的数据调整方法有最大/最小转换和Z得分转换。( )

 A对

 B错

卡方分布是通用的变量间是相互关联的统计模型。( )

 A对

 B错

在数据挖掘中的一个预测算法中,输入数据太少,会大大影响数据挖掘的准确度。( )

 A对

 B错

对于每次抽样,所决定的统计量取值和总体参数的误差只能是正的。( )

 A对

 B错

构建贝叶斯网络过程需要经过构建有向无环图和计算图中有向边的条件概率表两个步骤。( )

 A对

 B错

最大间隔分类器是通过计算空间的离散点距超平面的距离,找到一个合适的超平面。( )

 A对

 B错

在决策管理中引入的优化问题,基本属于( )的问题。

 A线性规划

 B非线性规划

 C整数规划

 D动态规划

当一个项目集I的相对支持度满足预先指定的( )支持度阈值,项目集I就是一个频繁项目集。

 A最大

 B最小

 C固定

 D随机

测试是用( )的数据来验证具体的决策定义。

 A批量

 B少量

 C随机

 D固定规模

CARMA算法只需要对数据进行( )次扫描就可以获得比Apriori算法更低的支持度的结果。

 A一

 B两

 C三

 D四

Apriori算法的评估公式是基于( )来计算的。

 A支持度

 B相似度

 C反对度

 D置信度

Apriori算法中的发现频繁项目集步骤中,首先扫描数据,从中发现包含( )个项的项目集。

 A1

 B2

 C3

 D4

决策者在使用决策管理系统时,使用频度最高的是( )。

 A测试

 B场景分析

 CWhat-If分析

 D验证

下列关于CARMA算法步骤的算法中错误的是( )。

 A在估计阶段的表格中记录项目集之间的关系

 B在验证阶段,需要计算候选项目集的规模

 C验证的第一步是将非频繁项目集从表格中删除

 D验证阶段的删除方式和表格裁剪方式相同

优化的基本内容都来自于运筹,线性规划只是优化和运筹的一部分。( )

 A对

 B错

CARMA算法是一种为减少Apriori算法的I/O消耗及时间和空间辅助度的改进算法。( )

 A对

 B错

线性规划仅仅适用于优化和运筹问题。( )

 A对

 B错

系统不仅可以提供详细的信息,还能做出决策。( )

 A对

 B错

战略层级的决策由企业的高层做出,也就是说企业高层不应当参与操作层面的决策。( )

 A对

 B错

决策管理系统并不是要取代已有的业务流程系统,而是通过决策自动化来增强它。( )

 A对

 B错

提升度小于1时表明其中一个项集的出现降低了另一个项集出现的可能性。

 A对

 B错

Apriori算法使用标准的发现关联规则的步骤,先发现数据中的频繁项目集,然后从中产生关联规则。( )

 A对

 B错

决策管理系统是工作在战术层级的,是以战术层级制定决策为实现目标的。( )

 A对

 B错

下列关于最优解的判定标准说法正确的是( )。

 A仅仅满足约束条件

 B仅仅满足目标函数

 C或者满足约束条件或者满足目标函数

 D既满足约束条件又满足目标函数

多目标规划中,指( )是多个的。

 A约束函数

 B自变量

 C因变量

 D目标函数

在给定营销预算的限制下,如何选择合适的客户进行精准营销。这属于( )问题。

 A线性规划

 B0-1规划

 C动态规划

 D多目标规划

当提升度( )时,称为正相关规则。

 A等于0

 B等于1

 C大于1

 D小于1

既要花费少,又要收益大的问题属于( )问题。

 A线性规划

 B0-1规划

 C动态规划

 D多目标规划

从数据中发现关联规则的问题可以转变为发现频繁项目集。( )

 A对

 B错

越低的最小支持度阈值产生的关联规则数量越少。

 A对

 B错

当提升度小于1时表明其中一个项集的出现降低了另一个项集出现的可能性。( )

 A对

 B错

当目标函数和约束函数中至少有一个变量的函数是非线性规划时,就是非线性规划。( )

 A对

 B错

采样的时间间隔越短,数据的丢失就( )。

 A越多

 B越少

 C越不确定

 D没有影响

下列对于时间序列理解错误的是( )。

 A大多数时间序列都是平稳的

 B时间序列是通过定期测量时间段中某个变量获得的一组观察值

 C公司每年的红利属于离散时间序列

 D季节周期与序列的时间间隔相联系

两步聚类算法主要处理较大规模的数据,可自动确定类的数目,能处理连续变量和分类变量的混合数据。( )

 A对

 B错

聚类中同一个组内的数据对象的相似性较低。( )

 A对

 B错

通过BIRCH聚类算法处理过的数据需要进行离群值的处理。( )

 A对

 B错

如果将自回归模型和移动平均模型结合,就能得到一个既包含自回归又包含移动平均的更精确的时间序列分析方法。( )

 A对

 B错

聚类中相似或不相似是基于数据描述属性的取值来确定的。( )

 A对

 B错

简单移动平均法的各元素的权重要有所差别。( )

 A对

 B错

通常,用时间转换方法将季节性变化转换为( )。

 A加法季节性变化

 B减法季节性变化

 C乘法积极性变化

 D除法季节性变化

下列关于聚类的说法错误的是( )。

 A聚类分析适合探讨样本间相互关联关系从而对一个样本结构做一个初步的评价

 B聚类是一种监督的学习方法。

 C聚类不依赖于事先确定的数据类别

 D聚类是观察式学习

如果当前时间点的值需要通过前两个时间点值的回归加上随机误差来计算,则称之为二阶自回归AR(2)。( )

 A对

 B错

对于时间序列的测量值,既可以是连续数据也可以是离散数据。( )

 A对

 B错

贝叶斯网络的价值主要有( )。

 A分类

 B预测

 C帮助了解因果关系

 D有效避免数据过度拟合

下列关于支持向量机的理论正确的是( )。

 A支持向量机的理论基础就是统计学习理论。

 B根据统计学习理论,学习机器的实际风险由经验风险值和置信范围值两部分组成

 C支持向量机在解决大样本、非线性机高维模式识别问题中表现出许多特有的优势

 D线性分类器是支持向量机的基础

下列关于决策表的说法错误的有( )。

 A决策表是指尝试从模型训练中发现一些规则

 B决策树和决策表是完全不相同的,也完全不相似

 C决策表的规则和记录是一一对应的

 D决策表按照规则的顺序来决定规则的优先级

数据挖掘是从大量数据中寻找其规律的技术,是( )的综合。

 A统计学

 B计算机网络技术

 C数据库技术

 D人工智能技术

下列关于差异的说法正确的有( )。

 A偶然因素引起的差异往往是比较显著的

 B差异的绝对值大于给定的标准的概率分布区间称为拒绝区间

 C事件属于接受区间则判断总体无显著差异

 D事件属于拒绝区间,则认为总体有显著差异

假设检验的步骤是( )。

 A提出假设

 B规定显著性水平

 C构造检验统计量

 D做出拒绝或接受零建设的决策

一般来讲,统计量的标准有( )。

 A无偏性

 B有偏性

 C一致性

 D有效性

神经元网络的拓扑结构可以分为( )。

 A前向型

 B反馈型

 C自组织竞争型

 D随机型网络

下列选项中,属于实施决策管理要求的是( )。

 A数据准备

 B资深的业务人员

 C数据分析师

 DIT准备

下列选项中,属于优化问题的有( )。

 A整数规划

 B网络规划

 C非光滑规划

 D几何规划

根据决策的广义理解,把决策看作是( )过程。

 A提出问题

 B确立目标

 C设计方案

 D选择方案

CARMA算法在估计阶段,保存项目集信息的表格初始时,会按照( )步骤更新。

 A增加统计量

 B插入项目集

 C裁剪表格

 D删除表格

发现关联规则的步骤是( )。

 A预选指定一个最小支持度计数阈值

 B找到所有超过这个值的项目集

 C从频繁项目集中产生强关联规则

 D从频繁项目集中产生弱关联规则

下列选项中,关于整数规划说法正确的是( )。

 A整数规划要求决策变量取整数值的数学规划

 B若线性规划中的变量取整数值,则称之为整数线性规划

 C在非线性规划中变量取整数值时,称之为整数非线性规划

 D如果要求变量的取值只能是0和1,则是0-1规划

衡量关联规则强弱的指标主要有( )。

 A支持度

 B置信度

 C相似度

 D提升度

时间序列的特征主要有( )。

 A趋势

 B季节性周期性变化

 C连续值

 D离群值

利用时间散点图可以分析时间序列是否存在( )。

 A趋势

 B季节性变化

 C离群值

 D缺失值

通过霍尔特指数平滑法可以处理( )的趋势。

 A随机

 B固定

 C非线性

 D线性

下列关于K均值算法理解正确的有( )。

 AK均值聚类算法是高效的,但是比较缓慢

 BK均值算法使簇内对象具有较高的相似度

 CK均值算法使簇间的相似度较低

 DK均值聚类算法的相似度的计算是根据一个簇中对象的平均值进行的

两步聚类算法的步骤为( )。

 A预聚类

 B归一化处理

 C离散值处理

 D聚类

下列选项中列出的聚类算法能很好处理大批量数据的有( )。

 ABIRCH聚类算法

 B分层聚类算法

 C两步聚类算法

 DK均值聚类算法

决定选择何种时间序列分析法的原则包括( )。

 A要解决的问题

 B目的

 C时间

 D时间序列数据的特点

K均值聚类算法的输入包括( )。

 A聚类个数K

 B初始中心

 Cn个数据对象

 D方差

考察聚类内的特征主要有( )。

 A标准差

 B聚类半径

 CSSE

 DSSB

BIRCH聚类算法在决定将某个记录划归到某个树上的节点时,会考虑该记录的( )特征。

 A变量的均值

 B变量的标准差

 C变量的方差

 D变量每个分类的个数

同指数平滑法相比,自回归模型具有( )。

 A灵活性

 B通用性

 C可靠性

 D适用性

提示:下载前请核对题目。客服微信:diandahome
下载的文档都包含参考答案
特别声明:以上内容(如有图片或文件亦包括在内)为“电大之家”用户上传并发布,仅代表该用户观点,本平台仅提供信息发布。