流式計(jì)算,就是對(duì)數(shù)據(jù)流進(jìn)行處理,是實(shí)時(shí)計(jì)算。批量計(jì)算則統(tǒng)一收集數(shù)據(jù),存儲(chǔ)到數(shù)據(jù)庫中,然后對(duì)數(shù)據(jù)進(jìn)行批量處理的數(shù)據(jù)計(jì)算方式。
(1)數(shù)據(jù)時(shí)效性不同:流式計(jì)算實(shí)時(shí)、低延遲, 批量計(jì)算非實(shí)時(shí)、高延遲。
(2)數(shù)據(jù)特征不同:流式計(jì)算的數(shù)據(jù)一般是動(dòng)態(tài)的、沒有邊界的,而批處理的數(shù)據(jù)一般則是靜態(tài)數(shù)據(jù)。
(3)應(yīng)用場(chǎng)景不同:流式計(jì)算應(yīng)用在實(shí)時(shí)場(chǎng)景,時(shí)效性要求比較高的場(chǎng)景,如實(shí)時(shí)推薦、業(yè)務(wù)監(jiān)控…批量計(jì)算一般說批處理,應(yīng)用在實(shí)時(shí)性要求不高、離線計(jì)算的場(chǎng)景下,數(shù)據(jù)分析、離線報(bào)表等。
(4)運(yùn)行方式不同:流式計(jì)算的任務(wù)持續(xù)進(jìn)行的,批量計(jì)算的任務(wù)則一次性完成
流式計(jì)算的價(jià)值在于業(yè)務(wù)方可在更短的時(shí)間內(nèi)挖掘業(yè)務(wù)數(shù)據(jù)中的價(jià)值,并將這種低延遲轉(zhuǎn)化為競(jìng)爭(zhēng)優(yōu)勢(shì)。
比方說,在使用流式計(jì)算的推薦引擎中,用戶的行為偏好可以在更短的時(shí)間內(nèi)反映在推薦模型中,推薦模型能夠以更低的延遲捕捉用戶的行為偏好以提供更精準(zhǔn)、及時(shí)的推薦。流式計(jì)算能做到這一點(diǎn)的原因在于,傳統(tǒng)的批量計(jì)算需要進(jìn)行數(shù)據(jù)積累,在積累到一定量的數(shù)據(jù)后再進(jìn)行批量處理;而流式計(jì)算能做到數(shù)據(jù)隨到隨處理,有效降低了處理延時(shí)。