江苏开放大学2024年春《大数据库管理 060602》第一次过程性考核作业(1~3单元)参考答案

2024年3月1221:35:44发布者:江开学习小虫 65 views 举报

单选题

1在Hadoop生态系统中,HBase指的是什么?

A数据流处理环境

BHadoop上的数据仓库

C分布式数据库

D分布式文件系统

答案:C

2下面对SecondaryNameNode第二名称节点的描述,哪个是错误的?

ASecondaryNameNode是HDFS架构中的一个组成部分

BSecondaryNameNode通过HTTP GET方式从NameNode上获取到FsImage和EditLog文件,并下载到本地的相应目录下

CSecondaryNameNode用来保存名称节点中对HDFS元数据信息的备份

DSecondaryNameNode一般是并行运行在多台机器上

答案:D

3在一个基本的Hadoop集群中,DataNode主要负责什么?

A负责执行由JobTracker指派的任务

B存储被拆分的数据块

C协调数据计算任务

D负责协调集群中的数据存储

答案:B

4下列哪一项不属于HDFS采用抽象的块概念带来的好处?

A适合数据备份

B强大的跨平台兼容性

C简化系统设计

D支持大规模文件存储

答案:B

5第一次信息化浪潮主要解决什么问题?

A信息爆炸

B信息传输

C信息处理

D信息转换

答案:C

6在Hadoop项目结构中,HDFS指的是什么?

A资源管理和调度器

B分布式并行编程模型

CHadoop上的数据仓库

D分布式文件系统

答案:

7下列哪个不属于Hadoop的特性?

A运行在Linux平台上

B高可靠性

C高容错性

D成本高

答案:

8下面哪个选项属于大数据技术的“数据存储和管理”技术层面的功能?  

A把实时采集的数据作为流计算系统的输入,进行实时处理分析

B利用分布式并行编程模型和计算框架,结合机器学习和数据挖掘算法,实现对海量数据的处理和分析

C构建隐私数据保护体系和数据安全体系,有效保护个人隐私和数据安全

D利用分布式文件系统、数据仓库、关系数据库等实现对结构化、半结构化和非结构化海量数据的存储和管理

答案:

9在HDFS中,NameNode的主要功能是什么?  

A维护block id 到DataNode本地文件的映射关系

B存储文件内容

C文件内容保存在磁盘中

D存储元数据

答案:

10下面哪个不是Hadoop1.0的组件?

AMapReduce

BHDFS

CYARN

DNameNode和DataNode

答案:

11在大数据的计算模式中,流计算解决的是什么问题?   

A针对大规模图结构数据的处理

B针对流数据的实时计算

C大规模数据的存储管理和查询分析

D针对大规模数据的批量处理

答案:

12下面对FsImage的描述,哪个是正确的?

AFsImage用于维护文件系统树以及文件树中所有的文件和文件夹的元数据

BFsImage记录了每个块具体被存储在哪个数据节点

CFsImage用于存储文件内容

DFsImage记录了所有针对文件的创建、删除、重命名等操作

答案:

13在Hadoop项目结构中,MapReduce指的是什么?

A流计算框架

B分布式并行编程模型

C提供分布式协调一致性服务

DHadoop上的工作流管理系统

答案:

14下列哪一个不属于Hadoop的大数据层的功能?

A数据挖掘

B实时计算

CBI分析

D离线分析

答案:

15Hadoop框架中最核心的设计是什么?

A提供整个HDFS文件系统的NameSpace(命名空间)管理、块管理等所有服务

BHadoop被视为事实上的大数据处理标准

CHadoop不仅可以运行在企业内部的集群中,也可以运行在云计算环境中

D为海量数据提供存储的HDFS和对数据进行计算的MapReduce

答案:

判断题

1在HDFS中,默认一个块的大小是64KB。

A正确

B错误

答案:

2HDFS采用了分层模型。

A正确

B错误

答案:

3Hadoop可以部署在廉价的计算机集群中。

A正确

B错误

答案:

4大数据的特点包括数据的“大量化”、快速化”、“多样化”、“高价值”。

A正确

B错误

答案:

5第三次信息化浪潮主要解决信息处理问题。

A正确

B错误

答案:

多选题

1HDFS数据块多副本存储具备以下哪些优点?

A适合多平台上运行

B加快数据传输速度

C保证数据可靠性

D容易检查数据错误

答案:

2下面哪个属于大数据的应用领域?

A实时掌握交通状况

B监控身体情况

C智能医疗研发 

D金融交易

答案:

3HDFS特殊的设计,在实现优良特性的同时,也使得自身具有一些应用局限性,主要包括以下哪几个方面?

A较差的跨平台兼容性

B不适合低延迟数据访问

C无法高效存储大量小文件

D不支持多用户写入及任意修改文件

答案:

4Hadoop的特性包括哪些?

A运行在Linux平台上

B支持多种编程语言

C高可扩展性

D高效性

答案:

5Hadoop集群的整体性能主要受到什么因素影响?

ACPU性能

B存储容量

C内存

D网络

答案:

6HDFS具有较高的容错性,设计了哪些相应的机制检测数据错误和进行自动恢复?

A数据出错

B数据源太大

C数据节点出错

D名称节点出错

答案:

7下列关于Hadoop的描述,哪些是正确的?

A为用户提供了系统底层细节透明的分布式基础架构

B曾经被公认为行业大数据标准开源软件

C可以部署在廉价的计算机集群中

D具有很好的跨平台特性

答案:

8HDFS的应用局限性,主要包括以下哪几个方面?  

A较差的跨平台兼容性

B无法高效存储大量小文件 

C不适合低延迟数据访问

D不支持多用户写入及任意修改文件

答案:

9对于HDFS中的客户端,下列描述哪些是正确的?

A客户端是用户操作HDFS最常用的方式,HDFS在部署时都提供了客户端

BHDFS客户端是一个库,暴露了HDFS文件系统接口

C客户端可以支持打开、读取、写入等常见的操作

D严格来说,客户端并不算是HDFS的一部分

答案:

10数据节点(DataNode)的主要功能包括哪些?

A负责数据的存储和读取

B根据客户端或者是名称节点的调度来进行数据的存储和检索

C用来保存名称节点中对HDFS元数据信息的备份,并减少名称节点重启的时间

D向名称节点定期发送自己所存储的块的列表

答案:

简答题

1请阐述大数据、云计算和物联网三者之间的关系。

答案:

提示:下载前请核对题目。客服微信:diandahome
下载的文档都包含参考答案
特别声明:以上内容(如有图片或文件亦包括在内)为“电大之家”用户上传并发布,仅代表该用户观点,本平台仅提供信息发布。