奥鹏南开大学23秋学期《大数据开发技术(二)》在线作业(高起本:1709-2103、专升本/高起专:2003-2103)

2024年2月211:26:20发布者:江开学习小虫 12 views 举报
总字数:约4791字
第1页
1/16页

第2页
2/16页

第3页
3/16页

第4页
4/16页

第5页
5/16页

一、单选题

25 题, 50

Scala 中()方法返回 Map 所有的 key

Akey

Bkeys

Cvalue

Dvalues

答案是: B

spark-submit 配置项中()表示每个 executor 使用的内核数

A--num-executors NUM

B--executor-memory MEM

C--total-executor-cores NUM

D--executor-coures NUM

答案是: D

MLlib 中,逻辑回归算法的输入值为()类型

ADouble

BLabledPoint

CPoint

DSGB

答案是: B

Mllib 中线性会馆算法中的参数 numIterations 表示()

A 要运行的迭代次数

B 梯度下降的步长

C 是否给数据加干扰特征或者偏差特征

DLasso ridge 的正规化参数

答案是: A

GraphX 中()是存放着存放顶点的 RDD

ARDD[Edge]

BEdgeRDD

CRDD[(VertexId,VD)]

DVertexRDD

答案是: C

图是一种数据元素间为()关系的数据结构

A 多对多

B 一对一

C 一对多

D 多对一

答案是: A

相关知识点 :

图数据转换

图数据查询

以下哪个不是 Scala 的数据类型()

AAnyRef

BAnything

CNULL

DNothing

答案是: B

Spark GraphX 中类 Graph reverse 方法可以()

A 反转图中所有边的方向

B 按照设定条件取出子图

C 取两个图的公共顶点和边作为新图,并保持前一个图顶点与边的属性

D 合并边相同的属性

答案是: A

以下哪个函数可以求两个 RDD 的笛卡尔积()

Aunion

Bsubstract

Cintersection

Dcartesian

答案是: D

相关知识点 :

高阶函数 : 高阶函数就是操作其他函数的函数 . 高阶函数可以使用函数

Spark 中的每个 RDD 一般情况下是由()个分区组成的

A0

B1

C

D 无数

答案是: C

()可以解决图计算问题

ASpark Core

BBlinkDB

CGraphX

DMllib

答案是: C

请问 RDD 的()操作用来计算 RDD 中所有元素个数

Acount

Bnum

Clength

Dnumber

答案是: A

Mllib metrics.fMeasureByThreshold

表示()指标

A 准确度

B 召回率

CF

DROC 曲线

答案是: C

MLlib 中可以调用 mllib.tree.DecisionTree 类中的静态方法()训练分类树

AtrainClassifier

BtrainRegressor

CLogisticRegressionModel

DLabeledPoint

答案是: A

相关知识点 :

分类

Spark DataFrame 的()方法是进行连接查询

Awhere

Bjoin

Climit

Dapply

答案是: B

Spark DataFrame 的()方法是进行条件查询

Awhere

Bjoin

Climit

Dapply

答案是: A

图结构中如果无重复的边或者顶点到自身的边,那么称之为()

A 完全图

B 有向完全图

C 无向图

D 简单图

答案是: D

Dstream 窗口操作中()方法返回一个基于源 DStream 的窗口批次计算后得到新的

DStream

Awindow

总页数:16
提示:下载前请核对题目。客服微信:diandahome
下载的文档都包含参考答案
特别声明:以上内容(如有图片或文件亦包括在内)为“电大之家”用户上传并发布,仅代表该用户观点,本平台仅提供信息发布。