大数据领域好用的开源软件有哪些-创新互联
本篇文章给大家分享的是有关大数据领域好用的开源软件有哪些,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。
网站建设哪家好,找创新互联建站!专注于网页设计、网站建设、微信开发、成都小程序开发、集团企业网站建设等服务项目。为回馈新老客户创新互联还提供了夏津免费建站欢迎大家使用!相信大家都明白开源软件的重要性,好用的开源软件真的是太多了。下面就主要针对大数据领域,给大家推荐十款好用的开源软件,即HBase、Hadoop分布式文件系统、Hive、Spark、Redis、SpagoBI、Lucene、HDP、CDH、HPCC。
1、HBase
HBase是为有数十亿行和数百万列的超大表设计的,这是一种分布式数据库,可以对大数据进行随机性的实时读取/写入访问。它有点类似谷歌的Bigtable,不过基于Hadoop和Hadoop分布式文件系统(HDFS)而建。
2、Hadoop分布式文件系统(HDFS)
HDFS是面向Hadoop的文件系统,不过它也可以用作一种独立的分布式文件系统。它基于Java,具有容错性、高度扩展性和高度配置性。支持的操作系统:Windows、Linux和OS X。
3、Hive
Apache Hive是面向Hadoop生态系统的数据仓库。它让用户可以使用HiveQL查询和管理大数据,这是一种类似SQL的语言。
4、Spark
作为MapReduce之外的一种选择,Spark是一种数据处理引擎。它声称,用在内存中时,其速度比MapReduce最多快100倍;用在磁盘上时,其速度比MapReduce最多快10倍。它可以与Hadoop和Apache Mesos一起使用,也可以独立使用。支持的操作系统:Windows、Linux和OS X。
5、Redis
Redis现在由Pivotal赞助,这是一种键值缓存和存储系统。提供收费支持。要注意:虽然该项目并不正式支持Windows,不过微软在GitHub上有一个Windows派生版。支持的操作系统:Linux。
6、SpagoBI
Spago被市场分析师们称为“开源领袖”,它提供商业智能、中间件和质量保证软件,另外还提供Java EE应用程序开发框架。该软件百分之分免费、开源,不过也提供收费的支持、咨询、培训及其他服务。
7、Lucene
基于Java的Lucene可以非常迅速地执行全文搜索。据官方网站声称,它在现代硬件上每小时能够检索超过150GB的数据,它含有强大而高效的搜索算法。开发工作得到了Apache软件基金会的赞助。
8、HDP
HDP是Apache Hadoop分发版。Hortonworks Data Platform(HDP)用于创建安全的企业数据湖,为企业提供实现快速、实时商业洞察力所需的分析信息。HDP是一个开源大数据的生态系统。
9、CDH
CDH是Apache Hadoop分发版。CDH除没有HDP那样开放开源外,其它都很类似。CDH文档都组织、整理的不错,可作为了解、学习大数据、Apache Hadoop的一个重要资源。
10、HPCC
在Apache Hadoop & Spark统治的大数据市场,HPCC显得弥足珍贵,值得更多关注。HPCC 包括以下核心组件:Thor (the Data Refinery Cluster);Roxie (Rapid Online XML Inquiry Engine, the Query Cluster);ECL (Enterprise Control Language)ECL IDE;ESP (Enterprise Services Platform)。HPCC在安全、身份和风险管理有众多成功案例。
以上就是大数据领域好用的开源软件有哪些,小编相信有部分知识点可能是我们日常工作会见到或用到的。希望你能通过这篇文章学到更多知识。更多详情敬请关注创新互联成都网站设计公司行业资讯频道。
另外有需要云服务器可以了解下创新互联scvps.cn,海内外云服务器15元起步,三天无理由+7*72小时售后在线,公司持有idc许可证,提供“云服务器、裸金属服务器、高防服务器、香港服务器、美国服务器、虚拟主机、免备案服务器”等云主机租用服务以及企业上云的综合解决方案,具有“安全稳定、简单易用、服务可用性高、性价比高”等特点与优势,专为企业上云打造定制,能够满足用户丰富、多元化的应用场景需求。
文章标题:大数据领域好用的开源软件有哪些-创新互联
转载来源:http://azwzsj.com/article/dioooi.html