Greenplum和Aster Data Systems是两家涉及大规模数据分析公司本周宣布,他们的产品将支持MapReduce,这是一种最初由Google开发的编程技术,用于在商用硬件上并行处理大型数据集。
软件开发人员更倾向于使用Java和C ++等语言,而不是数据库语言SQL,集群数据库系统制造商Aster的共同创始人兼首席执行官Mayank Bawa表示,“大多数开发人员都在为使数据库跳舞顺利的细微差别而苦苦挣扎,”他在一篇博文中写道。 “的确,需要SQL maestro才能执行有趣的数据转换查询(在ETL处理或Extract-Load-Transform处理期间)或数据挖掘(在分析期间)。”
输入MapReduce,其目标是提供“平凡的并行化框架,即使是新手开发人员(又名实习生)可以用各种语言(Java / C / C ++ / Perl / Python)编写程序来分析独立于规模的数据,”Bawa写道,“同时,Greenplum,据说这个数据库的制造商可以扩展到1兆字节的信息,本周表示,截至9月份,MapReduce框架将成为其数据流引擎的一部分。
这对双语公告带来了数据库的一名关闭观察员的赞同世界
“MapReduce本身可以在数据操作和分析方面做很多重要工作,将它与SQL集成应该增加其适用性和强大功能,”Monash Research的Curt Monash在DBMS2博客中写道。
“禁忌需要MapReduce数据管理。这是以其他方式高效地并行化的,“他补充道,”但是如果你想构建非表格结构,比如文本索引或图表,MapReduce会变得非常有用。“