引言
查詢(xún)分析是大數(shù)據(jù)要解決的核心問(wèn)題之一,而SQL作為查詢(xún)分析中使用最簡(jiǎn)單、最廣泛的的語(yǔ)言之一,必然而然的催生了許多支持在Hadoop上使用SQL的系統(tǒng),這就是所謂的SQL-on-Hadoop系統(tǒng),其中大眾熟知的Hive就是最早的SQL-on-Hadoop系統(tǒng)。
經(jīng)過(guò)若干年的發(fā)展,SQL-on-Hadoop系統(tǒng)已經(jīng)百花齊放,按照架構(gòu)劃分這些系統(tǒng)大致可以分為以下幾類(lèi):
*
MapReduce架構(gòu)系統(tǒng):如Hive,這類(lèi)系統(tǒng)是在MapReduce計(jì)算框架上封裝了一個(gè)SQL語(yǔ)義層,在運(yùn)行過(guò)程中把SQL轉(zhuǎn)換為MapReduce程序來(lái)執(zhí)行
* MPP架構(gòu)系統(tǒng):如Impala、Presto、Drill等,這類(lèi)系統(tǒng)采用MPP(Massively Parallel
Processing)架構(gòu),而非MapReduce
* 預(yù)計(jì)算系統(tǒng):如Druid、Kylin等,這類(lèi)系統(tǒng)
熱門(mén)工具 換一換
