在大数据关键技术中,Hadoop的分布式文件系统HDFS属于大数据(  )。

1294 次浏览
  • A、存储技术
  • B、分析技术
  • C、并行分析技术
  • D、挖掘技术
大数据所涉及的技术很多,主要包括数据采集、数据存储、数据管理、数据分析与挖掘四个环节。在数据采集阶段主要使用的技术是数据抽取工具ETL。在数据存储环节主要有结构化数据、非结构化数据和半结构化数据的存储与访问。结构化数据一般存放在关系数据库,通过数据查询语言(SQL)来访问;非结构化和半结构化数据一般通过分布式文件系统的NoSQL进行存储。大数据管理主要使用了分布式并行处理技术,比较常用的有MapReduce,编程人员借助它可以在不会分布式并行编程的情况下,将自己的程序运行在分布式系统上。数据分析与挖掘是根据业务需求对大数据进行关联、聚类、分类等钻取和分析,并利用图形、表格加以展示,与ETL一样,数据分析和挖掘是以前数据仓库的范畴,只是在大数据中得以更好地利用。在最流行的开源大数据Hadoop中,Hadoop分布式文件系统HDFS(Hadoop Distributed File System)是Hadoop项目的核心子项目,是分布式计算中数据存储管理的基础,是基于流数据模式访问和处理超大文件的需求而开发的,可以运行于廉价的商用服务器上。
挑战成功
1年前
挑战成功
1年前
挑战成功
2年前
挑战失败
2年前
挑战成功
3年前
挑战成功
3年前
挑战成功
3年前
挑战成功
3年前
挑战失败
3年前
挑战失败
3年前

微信公众号

有课学公众号
  • 微信公众号: geekdaxue