启动Aster Data Systems Aster公司首席执行官Mayank Bawa在博客中写道:“传统上,我们认为数据仓库是后台任务,”他表示,“我们认为数据仓库是后台任务。”星期二后。 “数据仓库可以在单独的加载窗口中加载;加载可能会延迟(实际结果是业务用户会迟到);加载,备份和扩展可以使数据仓库脱机 - 这是正确的这些任务可以在非工作时间(夜间/周末)完成。“
但是,Aster的客户,包括互联网广告传送网络aCerno,”依靠数据分析获取收入“,Bawa说。 Aster的nCluster 3.0可将工作负载分散到多台服务器上,并可轻松添加额外的机器以获得更高的功耗。该软件还将数据分析工作负载的各个组成部分分解为不连续的部分。
“加载程序”层处理数据加载和导出到外部源和从外部源导出; “工作人员”层将数据存储在本地连接的磁盘上进行查询;并且一层“皇后”节点执行智能查询规划和处理
同时,用户使用群集就好像它是单个实体
选择性扩展群集段的能力意味着用户可以添加资源在他们最需要的地方,
对于这些核心功能,3.0版本增加了许多“永远在线”功能,包括增加容量,重新平衡数据和恢复数据的能力,而系统是实时的
Aster还致力于在系统中增加并行化,据一位公司官员称,“我们希望构建能够处理比现在任何其他系统多10倍,100倍以上数据的系统,但这也是如此许多数据为任何单一的商品服务器,说:“首席技术官Tasso Argyros在博客文章。 “所以我们花费了大量的研发工作来并行化系统的每个功能 - 不仅要查询,还要加载数据导出,备份和升级。另外,我们允许用户选择他们想要并行化所有这些功能,而不必扩大整个系统。“
该版本还包括对MapReduce的支持,MapReduce是Google最初开发的一种编程技术,它使开发人员可以更轻松地编写用于分析大量数据的程序。 Aster的竞争对手Greenplum最近还宣布支持MapReduce。
其他功能还包括为单个表选择数据压缩级别的功能,即“单击”升级工具;以及更好的安全功能,如用于身份验证的LDAP(轻型目录访问协议)以及在群集,数据库和表级别管理用户权限的功能。
许多Aster的初始客户(包括MySpace)都是以Web为中心的,Monash Research总裁Curt Monash说道,“数据仓库的巨大增长和机遇在于处理相对较新的数据,”他说。 “有大型数据仓库处理传统的OLTP,交易数据,但Aster不一定是分析这种数据的主要竞争对手。分析大量数据的甜蜜点当前是Web数据和相关的网络事件。”
Monash引用并行处理管理和支持MapReduce作为Aster的主要优势:“Aster是一家相对不成熟产品的创业公司,但他们已经考虑了如何使并行处理更容易管理。”
NCluster 3.0运行在标准x86服务器上。定价基于多少数据被管理。该公司此前表示,成本起价为100,000美元。