一、单选题
共 25 题, 50 分
Scala 中()方法返回 Map 所有的 key
Akey
Bkeys
Cvalue
Dvalues
答案是: B
spark-submit 配置项中()表示每个 executor 使用的内核数
A--num-executors NUM
B--executor-memory MEM
C--total-executor-cores NUM
D--executor-coures NUM
答案是: D
在 MLlib 中,逻辑回归算法的输入值为()类型
ADouble
BLabledPoint
CPoint
DSGB
答案是: B
Mllib 中线性会馆算法中的参数 numIterations 表示()
A 要运行的迭代次数
B 梯度下降的步长
C 是否给数据加干扰特征或者偏差特征
DLasso 和 ridge 的正规化参数
答案是: A
GraphX 中()是存放着存放顶点的 RDD
ARDD[Edge]
BEdgeRDD
CRDD[(VertexId,VD)]
DVertexRDD
答案是: C
图是一种数据元素间为()关系的数据结构
A 多对多
B 一对一
C 一对多
D 多对一
答案是: A
相关知识点 :
图数据转换
图数据查询
以下哪个不是 Scala 的数据类型()
AAnyRef
BAnything
CNULL
DNothing
答案是: B
Spark GraphX 中类 Graph 的 reverse 方法可以()
A 反转图中所有边的方向
B 按照设定条件取出子图
C 取两个图的公共顶点和边作为新图,并保持前一个图顶点与边的属性
D 合并边相同的属性
答案是: A
以下哪个函数可以求两个 RDD 的笛卡尔积()
Aunion
Bsubstract
Cintersection
Dcartesian
答案是: D
相关知识点 :
高阶函数 : 高阶函数就是操作其他函数的函数 . 高阶函数可以使用函数
Spark 中的每个 RDD 一般情况下是由()个分区组成的
A0
B1
C 多
D 无数
答案是: C
()可以解决图计算问题
ASpark Core
BBlinkDB
CGraphX
DMllib
答案是: C
请问 RDD 的()操作用来计算 RDD 中所有元素个数
Acount
Bnum
Clength
Dnumber
答案是: A
Mllib 中 metrics.fMeasureByThreshold
表示()指标
A 准确度
B 召回率
CF 值
DROC 曲线
答案是: C
MLlib 中可以调用 mllib.tree.DecisionTree 类中的静态方法()训练分类树
AtrainClassifier
BtrainRegressor
CLogisticRegressionModel
DLabeledPoint
答案是: A
相关知识点 :
分类
Spark 中 DataFrame 的()方法是进行连接查询
Awhere
Bjoin
Climit
Dapply
答案是: B
Spark 中 DataFrame 的()方法是进行条件查询
Awhere
Bjoin
Climit
Dapply
答案是: A
图结构中如果无重复的边或者顶点到自身的边,那么称之为()
A 完全图
B 有向完全图
C 无向图
D 简单图
答案是: D
Dstream 窗口操作中()方法返回一个基于源 DStream 的窗口批次计算后得到新的
DStream 。
Awindow