Druid 对比 Hadoop

honeymoose · June 12, 2023, 1:40pm

Hadoop 向世界证明，花费很少的钱实现典型的解决方案, 将数据保存在一般的商用机器的数据仓库里是可行的. 当人们将自己的数据保存在 Hadoop，他们发现两个问题

他们能够用一种相当灵活的方式查询数据来解答任何问题。

第一次运行Hadoop, 每个人都会感到高兴。后面使用Hadoop进行交互性查询后，他们意识到Hadoop只优化了吞吐量，没有优化延时。

Druid完全是Hadoop的一个补充。 Hadoop精于存储和查询的大量的低价值个体数据. 不幸的是Hadoop不精于保证这些数据的查询时间, 也不善于提供为客户操作的特征。

相反 Druid，善于处理hadoop 只中低价值数据的汇总数据，是查询汇总数据高效和高可用，能够直接暴漏给客户使用。

Druid 需要基础设施提供深存储. HDFS 可以作为深存储的一种。

Druid 可以利用 Hadoop 的 HDFS 来作为存储提供服务。