Durid是在2013年底開源出來的,當(dāng)前最新版本0.9.2, 主要解決的是對實(shí)時數(shù)據(jù)以及較近時間的歷史數(shù)據(jù)的多維查詢提供高并發(fā)(多用戶),低延時,高可靠性的問題。對比Druid與其他解決方案,Kylin對數(shù)據(jù)按照分區(qū)每天構(gòu)建前一天的cube數(shù)據(jù)提供給用戶查詢,用戶查詢的是歷史數(shù)據(jù)。而Druid不斷的從ingest去拉取數(shù)據(jù),持續(xù)構(gòu)建cube,提供實(shí)時查詢,主要作者下面兩位, 其中一位創(chuàng)建了一家公司繼續(xù)發(fā)展druid (Impty.io)
目錄:
- Druid特性
- 使用場景
- Druid介紹
- 角色功能
- 架構(gòu)介紹
- Segment
- 分布式集群
Durid特性
- 亞秒級查詢:druid提供了快速的聚合能力以及亞秒級的OLAP查詢能力,多租戶的設(shè)計(jì),是面向用戶分析應(yīng)用的理想方式
- 實(shí)時數(shù)據(jù)注入:druid支持流數(shù)據(jù)的注入,并提供了數(shù)據(jù)的事件驅(qū)動,保證在實(shí)時和離線環(huán)境下事件的實(shí)效性和統(tǒng)一性
- 可擴(kuò)展的PB級存儲:druid集群可以很方便的擴(kuò)容到PB的數(shù)據(jù)量,每秒百萬級別的數(shù)據(jù)注入。即便在加大數(shù)據(jù)規(guī)模的情況下,也能保證時其效性
- 多環(huán)境部署:druid既可以運(yùn)行在商業(yè)的硬件上,也可以運(yùn)行在云上。它可以從多種數(shù)據(jù)系統(tǒng)中注入數(shù)據(jù),包括hadoop,spark,kafka,storm和samza等
- 豐富的社區(qū):druid擁有豐富的社區(qū),供大家學(xué)習(xí)
使用場景
第一:適用于清洗好的記錄實(shí)時錄入,但不需要更新操作
第二:支持寬表,不用join的方式(換句話說就是一張單表)
第三:可以總結(jié)出基礎(chǔ)的統(tǒng)計(jì)指標(biāo),可以用一個字段表示
第四:對時區(qū)和時間維度(year、month、week、day、h