Hadoop 向世界证明, 花费很少的钱实现典型的解决方案, 将数据保存在一般的商用机器的数据仓库里是可行的. 当人们将自己的数据保存在 Hadoop, 他们发现两个问题
-
他们能够用一种相当灵活的方式查询数据来解答任何问题。
-
这个查询花费很多时间
第一次运行Hadoop, 每个人都会感到高兴。 后面使用Hadoop进行交互性查询后, 他们意识到Hadoop只优化了吞吐量, 没有优化延时。
Druid完全是Hadoop的一个补充。 Hadoop精于存储和查询的大量的低价值个体数据. 不幸的是Hadoop不精于保证这些数据的查询时间, 也不善于提供为客户操作的特征。
相反 Druid, 善于处理hadoop 只中低价值数据的汇总数据, 是查询汇总数据高效和高可用, 能够直接暴漏给客户使用。
Druid 需要基础设施提供深存储. HDFS 可以作为深存储的一种。
Druid 可以利用 Hadoop 的 HDFS 来作为存储提供服务。