单选题
1在Hadoop生态系统中,HBase指的是什么?
A数据流处理环境
BHadoop上的数据仓库
C分布式数据库
D分布式文件系统
答案:C
2下面对SecondaryNameNode第二名称节点的描述,哪个是错误的?
ASecondaryNameNode是HDFS架构中的一个组成部分
BSecondaryNameNode通过HTTP GET方式从NameNode上获取到FsImage和EditLog文件,并下载到本地的相应目录下
CSecondaryNameNode用来保存名称节点中对HDFS元数据信息的备份
DSecondaryNameNode一般是并行运行在多台机器上
答案:D
3在一个基本的Hadoop集群中,DataNode主要负责什么?
A负责执行由JobTracker指派的任务
B存储被拆分的数据块
C协调数据计算任务
D负责协调集群中的数据存储
答案:B
4下列哪一项不属于HDFS采用抽象的块概念带来的好处?
A适合数据备份
B强大的跨平台兼容性
C简化系统设计
D支持大规模文件存储
答案:B
5第一次信息化浪潮主要解决什么问题?
A信息爆炸
B信息传输
C信息处理
D信息转换
答案:C
6在Hadoop项目结构中,HDFS指的是什么?
A资源管理和调度器
B分布式并行编程模型
CHadoop上的数据仓库
D分布式文件系统
答案:
7下列哪个不属于Hadoop的特性?
A运行在Linux平台上
B高可靠性
C高容错性
D成本高
答案:
8下面哪个选项属于大数据技术的“数据存储和管理”技术层面的功能?
A把实时采集的数据作为流计算系统的输入,进行实时处理分析
B利用分布式并行编程模型和计算框架,结合机器学习和数据挖掘算法,实现对海量数据的处理和分析
C构建隐私数据保护体系和数据安全体系,有效保护个人隐私和数据安全
D利用分布式文件系统、数据仓库、关系数据库等实现对结构化、半结构化和非结构化海量数据的存储和管理
答案:
9在HDFS中,NameNode的主要功能是什么?
A维护block id 到DataNode本地文件的映射关系
B存储文件内容
C文件内容保存在磁盘中
D存储元数据
答案:
10下面哪个不是Hadoop1.0的组件?
AMapReduce
BHDFS
CYARN
DNameNode和DataNode
答案:
11在大数据的计算模式中,流计算解决的是什么问题?
A针对大规模图结构数据的处理
B针对流数据的实时计算
C大规模数据的存储管理和查询分析
D针对大规模数据的批量处理
答案:
12下面对FsImage的描述,哪个是正确的?
AFsImage用于维护文件系统树以及文件树中所有的文件和文件夹的元数据
BFsImage记录了每个块具体被存储在哪个数据节点
CFsImage用于存储文件内容
DFsImage记录了所有针对文件的创建、删除、重命名等操作
答案:
13在Hadoop项目结构中,MapReduce指的是什么?
A流计算框架
B分布式并行编程模型
C提供分布式协调一致性服务
DHadoop上的工作流管理系统
答案:
14下列哪一个不属于Hadoop的大数据层的功能?
A数据挖掘
B实时计算
CBI分析
D离线分析
答案:
15Hadoop框架中最核心的设计是什么?
A提供整个HDFS文件系统的NameSpace(命名空间)管理、块管理等所有服务
BHadoop被视为事实上的大数据处理标准
CHadoop不仅可以运行在企业内部的集群中,也可以运行在云计算环境中
D为海量数据提供存储的HDFS和对数据进行计算的MapReduce
答案:
判断题
1在HDFS中,默认一个块的大小是64KB。
A正确
B错误
答案:
2HDFS采用了分层模型。
A正确
B错误
答案:
3Hadoop可以部署在廉价的计算机集群中。
A正确
B错误
答案:
4大数据的特点包括数据的“大量化”、快速化”、“多样化”、“高价值”。
A正确
B错误
答案:
5第三次信息化浪潮主要解决信息处理问题。
A正确
B错误
答案:
多选题
1HDFS数据块多副本存储具备以下哪些优点?
A适合多平台上运行
B加快数据传输速度
C保证数据可靠性
D容易检查数据错误
答案:
2下面哪个属于大数据的应用领域?
A实时掌握交通状况
B监控身体情况
C智能医疗研发
D金融交易
答案:
3HDFS特殊的设计,在实现优良特性的同时,也使得自身具有一些应用局限性,主要包括以下哪几个方面?
A较差的跨平台兼容性
B不适合低延迟数据访问
C无法高效存储大量小文件
D不支持多用户写入及任意修改文件
答案:
4Hadoop的特性包括哪些?
A运行在Linux平台上
B支持多种编程语言
C高可扩展性
D高效性
答案:
5Hadoop集群的整体性能主要受到什么因素影响?
ACPU性能
B存储容量
C内存
D网络
答案:
6HDFS具有较高的容错性,设计了哪些相应的机制检测数据错误和进行自动恢复?
A数据出错
B数据源太大
C数据节点出错
D名称节点出错
答案:
7下列关于Hadoop的描述,哪些是正确的?
A为用户提供了系统底层细节透明的分布式基础架构
B曾经被公认为行业大数据标准开源软件
C可以部署在廉价的计算机集群中
D具有很好的跨平台特性
答案:
8HDFS的应用局限性,主要包括以下哪几个方面?
A较差的跨平台兼容性
B无法高效存储大量小文件
C不适合低延迟数据访问
D不支持多用户写入及任意修改文件
答案:
9对于HDFS中的客户端,下列描述哪些是正确的?
A客户端是用户操作HDFS最常用的方式,HDFS在部署时都提供了客户端
BHDFS客户端是一个库,暴露了HDFS文件系统接口
C客户端可以支持打开、读取、写入等常见的操作
D严格来说,客户端并不算是HDFS的一部分
答案:
10数据节点(DataNode)的主要功能包括哪些?
A负责数据的存储和读取
B根据客户端或者是名称节点的调度来进行数据的存储和检索
C用来保存名称节点中对HDFS元数据信息的备份,并减少名称节点重启的时间
D向名称节点定期发送自己所存储的块的列表
答案:
简答题
1请阐述大数据、云计算和物联网三者之间的关系。
答案: