分類導(dǎo)航

Durid(一): 原理架構(gòu)

發(fā)布時間：2016年11月22日作者：文章轉(zhuǎn)自網(wǎng)絡(luò)，版權(quán)歸原作者所有，反饋可立刻刪除 (該文來自筆記，點(diǎn)擊查看原文)

Durid是在2013年底開源出來的，當(dāng)前最新版本0.9.2, 主要解決的是對實(shí)時數(shù)據(jù)以及較近時間的歷史數(shù)據(jù)的多維查詢提供高并發(fā)(多用戶)，低延時，高可靠性的問題。對比Druid與其他解決方案，Kylin對數(shù)據(jù)按照分區(qū)每天構(gòu)建前一天的cube數(shù)據(jù)提供給用戶查詢，用戶查詢的是歷史數(shù)據(jù)。而Druid不斷的從ingest去拉取數(shù)據(jù)，持續(xù)構(gòu)建cube，提供實(shí)時查詢，主要作者下面兩位, 其中一位創(chuàng)建了一家公司繼續(xù)發(fā)展druid (Impty.io)

目錄：

Druid特性
使用場景
Druid介紹
角色功能
架構(gòu)介紹
Segment
分布式集群

Durid特性

亞秒級查詢：druid提供了快速的聚合能力以及亞秒級的OLAP查詢能力，多租戶的設(shè)計(jì)，是面向用戶分析應(yīng)用的理想方式
實(shí)時數(shù)據(jù)注入：druid支持流數(shù)據(jù)的注入，并提供了數(shù)據(jù)的事件驅(qū)動，保證在實(shí)時和離線環(huán)境下事件的實(shí)效性和統(tǒng)一性
可擴(kuò)展的PB級存儲：druid集群可以很方便的擴(kuò)容到PB的數(shù)據(jù)量，每秒百萬級別的數(shù)據(jù)注入。即便在加大數(shù)據(jù)規(guī)模的情況下，也能保證時其效性
多環(huán)境部署：druid既可以運(yùn)行在商業(yè)的硬件上，也可以運(yùn)行在云上。它可以從多種數(shù)據(jù)系統(tǒng)中注入數(shù)據(jù)，包括hadoop，spark，kafka，storm和samza等
豐富的社區(qū)：druid擁有豐富的社區(qū)，供大家學(xué)習(xí)

使用場景

第一：適用于清洗好的記錄實(shí)時錄入，但不需要更新操作
第二：支持寬表，不用join的方式（換句話說就是一張單表）
第三：可以總結(jié)出基礎(chǔ)的統(tǒng)計(jì)指標(biāo)，可以用一個字段表示
第四：對時區(qū)和時間維度(year、month、week、day、h

我想了解如何學(xué)習(xí)

分類導(dǎo)航

Durid(一): 原理架構(gòu)

延伸閱讀

我想了解如何學(xué)習(xí)