Car-tech

Cloudera Preps企业级Hadoop

Cloudera Tutorial | Cloudera Manager Quickstart VM | Cloudera Hadoop Training | Edureka

Cloudera Tutorial | Cloudera Manager Quickstart VM | Cloudera Hadoop Training | Edureka
Anonim

Cloudera推出了一套新的Hadoop管理工具,名为Cloudera Enterprise该公司将于周二宣布提供年度订购费用。它还更新了其开源的Hadoop分发包。这两个新版本以及与数据管理软件供应商的几个新的合作伙伴关系显示,该公司正在准备提供新兴的数据库技术 - 目前主要用于通过像Google和雅虎这样的网络巨头将企业市场作为关系数据库的替代品。“

我们的赌注不仅是大型网络公司,而且银行,医院和保险公司也会发现他们需要分析复杂和结构化数据在一起,而Hadoop就是为此而设计的,“Cloudera首席执行官Mike Olson说。 “Hadoop以一种全新的方式解决了一个新问题。”

Hadoop是非SQL或NoSQL数据库数量不断增加的一种,它基于Google MapReduce,这是一种用于在大量计算机上并行处理数据的框架节点。 Hadoop现在被Apache Software Foundation开发为一个开源项目,它提供了传统关系数据库的替代方案,至少在分析大型,快速变化的数据集的情况下是如此。

它可以同时用于SQL和非SQL -SQL数据,并且比关系数据库更容易发生服务器故障,Olson说。“Cloudera为中级组织打包了Hadoop,包括Hadoop发行版以及最新发布的一套管理工具。 Olson表示,这两个软件包都应该允许那些在Hadoop方面没有很多深入技术经验的组织来运行该软件。 “如果你有谷歌缩放的数据,Hadoop就可以使用,但有许多用户仅仅希望分析几TB的数据,”Olson说,“Cloudera的Hadoop发行版(CDH)是这是一个基于Hadoop Common(以前称为Hadoop Core)构建的预集成软件程序的开源软件包。该软件包包括:提供数据仓库基础架构的Hive; HBase,Hadoop的基础数据库; Pig,地图缩小程序的编译器; Zookeper,一个用于在多个服务器上运行应用程序的计划,以及MapReduce。

在新发布的版本3中,该软件包包含三个程序,该程序在Apache V2开源许可证下作为开源项目发布。一个是Flume,它可以帮助将数据加载到Hadoop中。另一个新增功能是Oozie,它是一款工作流管理软件。最后一个是Hadoop用户环境(HUE)代码,它提供了用于管理Hadoop的用户界面。“HUE允许任何人构建针对分析师的应用程序,它知道如何与Hadoop集群进行对话,”Olson说。

Cloudera Enterprise软件包使用其他管理工具增强了CDH版本3。这种非开源的新软件允许管理员通过使用轻量级目录访问协议来控制访问管理。此外,还提供程序来提供资源,进行配置和性能监控。

Olson不会讨论Cloudera迄今为止从订阅和咨询费用中赚取的多少,但注意到2010年第一季度,该公司制造了尽可能多的Olson表示,在不同的行业中,金融服务,电信,零售,政府和网络商业公司都对这项技术表现出了兴趣。“公司在Hadoop上所做的事情各不相同。一般来说,这些人从很多地方捕捉大量数据,并且需要对其进行复杂的分析,“Olson说。 “金融服务部门有意使用Hadoop进行欺诈检测,在电信方面,确实需要优化网络并减少客户流失。”

除了提供这些软件包外,Cloudera还一直在支持Hadoop的商业智能(BI)和数据管理软件提供商。

Olson计划在2010年Hadoop峰会的主题演讲中宣布,加利福尼亚州,商业智能供应商MicroStrategy将支持Hadoop的使用。另一个新合作伙伴是Talend,一家开源数据集成软件供应商。该公司已扩展其Talend Integration Suite以与Hadoop数据库进行交互。其套件允许管理员从单个控制台管理和聚合多个数据源。利用Hadoop,该软件“可以本地插入或检索数据,并在Hadoop架构内处理数据,”Talend营销副总裁Yves de Montcheuil表示。“Microstrategy和Talend加入越来越多的公司准备开源或Hadoop的商业管理工具。上周,Cloudera和Quest开始了一个项目,构建可以将Hadoop与Oracle数据库相连接的软件。 5月,开源商业智能公司Pentaho宣布其BI套件将与Hadoop数据库协同工作。

雅虎首席技术官Raymie Stata在一次对IDG新闻服务的单独访谈中指出,Hadoop可以减少构建超级计算机的需求分析大型数据集。传统上,大数据集已经从存储转移到超级计算机,这是一个集合的服务器集合,进行分析。相比之下,Hadoop将分析计算转移到了数据所在的位置,从而消除了对中型庞大数字运算机器的需求。雅虎是Hadoop的早期主要贡献者

除了Cloudera的产品,Hadoop也正在由IBM商业化,​​IBM最近开始提供一套使用该技术的分析服务。

Joab Jackson涵盖了企业软件和一般技术突发新闻

IDG新闻服务

。在@Joab_Jackson的Twitter上关注Joab。 Joab的电子邮件地址是[email protected]