實(shí)際問(wèn)題
在流計(jì)算場(chǎng)景中,數(shù)據(jù)會(huì)源源不斷的流入Apache Flink系統(tǒng),每條數(shù)據(jù)進(jìn)入Apache
Flink系統(tǒng)都會(huì)觸發(fā)計(jì)算。如果我們想進(jìn)行一個(gè)Count聚合計(jì)算,那么每次觸發(fā)計(jì)算是將歷史上所有流入的數(shù)據(jù)重新新計(jì)算一次,還是每次計(jì)算都是在上一次計(jì)算結(jié)果之上進(jìn)行增量計(jì)算呢?答案是肯定的,Apache
Flink是基于上一次的計(jì)算結(jié)果進(jìn)行增量計(jì)算的。那么問(wèn)題來(lái)了:
"上一次的計(jì)算結(jié)果保存在哪里,保存在內(nèi)存可以嗎?",答案是否定的,如果保存在內(nèi)存,在由于網(wǎng)絡(luò),硬件等原因造成某個(gè)計(jì)算節(jié)點(diǎn)失敗的情況下,上一次計(jì)算結(jié)果會(huì)丟失,在節(jié)點(diǎn)恢復(fù)的時(shí)候,就需要將歷史上所有數(shù)據(jù)(可能十幾天,上百天的數(shù)據(jù))重新計(jì)算一次,所以為了避免這種災(zāi)難性的問(wèn)題發(fā)生,Apache
Flink 會(huì)利用State存儲(chǔ)計(jì)算結(jié)果。本篇將會(huì)為大家介紹Apache Flink S
熱門工具 換一換
