HDFS有哪些显著的特点

小编给大家分享一下HDFS有哪些显著的特点,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!

为丘北等地区用户提供了全套网页设计制作服务,及丘北网站建设行业解决方案。主营业务为网站制作、网站设计、丘北网站设计,以传统方式定制建设网站,并提供域名空间备案等一条龙服务,秉承以专业、用心的态度为用户提供真诚的服务。我们深信只要达到每一位用户的要求,就会得到认可,从而选择与我们长期合作。这样,我们也可以走得更远!

分布式文件系统(Hadoop Distributed File System)是Hadoop核心子项目,为Hadoop提供了一个综合性的文件系统抽象,并且只会实现了多类文件系统的接口。HDFS基于流式数据访问、存储和处理超大文件。

在HDFS中引入了存放元数据信息的服务器:NameNode和实际存放数据的服务器:DataNode。

HDFS有着显著的特点

  • 存储数据较大

运行在HDFS的应用程序的数据处理有较大的需求,从存储GB到存储TB级别的超大文件,在目前的实际应用中,HDFS以及被利用来管理存储PB级别的数据

  • 支持多硬件平台

Hadoop可以运行在廉价、异构的商用硬件集群上,并且可以在HDFS设计时充分考虑数据的可靠性、安全性、高可用性

  • 支持流式数据

HDFS有一个设计思路是“写入一次,多次读取”、数据源生成数据集后,会被复制分发到不同的存储节点,已用于响应数据分析任务的请求。HDFS放宽了可移植操作系统接口的要求,可以以流的形式访问文件系统中的数据

  • 数据的一致性高

因为采用“写入一次,多次读取”的策略,所以支持追加不支持多次修改,降低了数据不一致性的造成可能

  • 有效预防硬件失效

HDFS的设计能够有效预防硬件异常并且具有自动恢复数据的能力

  • 高容错性

HDFS能够自动保存数据的多个副本,并且能够自动将失败的任务重新发配,具有高容错性

所以,HDFS经常被使用于各个场景下,例如:

大数据存储:分布式存储

日志处理:擅长日志分析

ETL:数据可抽取到MySQL,oracle,Lucene

机器学习

搜索引擎

但是,相对于的,HDFS也有不适应的地方

不适合低延迟的数据访问

HDFS不适合处理那些数据访问要求低延迟的请求,因为HDFS主要是为了高数据的吞吐设计的,会产生稿时间延迟的代价

无法高效的存储大量小文件

HDFS采用主从架构来存储数据,需要用到NameNode来管理文件系统的元数据,以响应请求。为了快速响应请求,元数据存在主节点的内存中,如果小文件数量多达,容易造成内存不足,导致系统错误

以上是“HDFS有哪些显著的特点”这篇文章的所有内容,感谢各位的阅读!相信大家都有了一定的了解,希望分享的内容对大家有所帮助,如果还想学习更多知识,欢迎关注创新互联行业资讯频道!


标题名称:HDFS有哪些显著的特点
分享URL:http://azwzsj.com/article/jeeoph.html