2016-2022 All Rights Reserved.平安財(cái)經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082 備案號(hào):閩ICP備19027007號(hào)-6
本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。
谷歌去年6月宣布將Cloud Dataflow作為一項(xiàng)托管服務(wù),旨在幫助公司以批處理和實(shí)時(shí)流模式提取和分析海量數(shù)據(jù)集。去年12月,該公司向開源社區(qū)發(fā)布了Cloud Dataflow軟件開發(fā)套件,以鼓勵(lì)軟件開發(fā)人員編寫易于與托管服務(wù)以及其他執(zhí)行環(huán)境集成的應(yīng)用程序。
這一舉措的結(jié)果之一是在Cloudera的開源Apache Spark引擎發(fā)行版上運(yùn)行的Cloud Dataflow版本,用于大規(guī)模數(shù)據(jù)處理。Cloudera和Google于1月20日宣布了新的Dataflow“運(yùn)行程序” ,開發(fā)人員將可以將Dataflow管道作為目標(biāo),以便在云托管或本地Spark集群以及Google托管服務(wù)上執(zhí)行。
Cloud Dataflow最引人注目的方面之一是它對(duì)可以同時(shí)執(zhí)行批處理和流模式的流水線邏輯的支持,Cloudera數(shù)據(jù)科學(xué)高級(jí)總監(jiān)Josh Wills在該公司的博客中宣布了這一新發(fā)展。
Wills說(shuō),Cloud Dataflow的流傳輸功能比Spark Streaming所提供的先進(jìn),而其批處理執(zhí)行引擎可優(yōu)化不處理流數(shù)據(jù)的管道的性能。
Cloud Dataflow結(jié)合了Google多年來(lái)在內(nèi)部用于大型數(shù)據(jù)處理的幾種主要技術(shù),包括MapReduce,F(xiàn)lumeJava批處理引擎和MillWheel流處理引擎。谷歌云平臺(tái)團(tuán)隊(duì)的產(chǎn)品經(jīng)理埃里克·施密特(Eric Sc??hmidt)說(shuō):“數(shù)據(jù)流是我們對(duì)數(shù)據(jù)處理技術(shù)的綜合投資。” 他說(shuō):“從開發(fā)人員的角度來(lái)看,它是一種編程模型和一種托管服務(wù)。”
Google去年12月發(fā)布的Cloud Dataflow SDK為開發(fā)人員提供了一種編寫結(jié)合了批處理和流處理功能的大數(shù)據(jù)應(yīng)用程序的方式,而無(wú)需使用單獨(dú)的編程模型或單獨(dú)的基礎(chǔ)結(jié)構(gòu)來(lái)運(yùn)行它們。
施密特說(shuō):“他們以前必須做的是運(yùn)行一個(gè)不同的SDK。” 他說(shuō):“您要么讓一組用戶執(zhí)行靜態(tài)的MapReduce批處理作業(yè),要么就擁有另一個(gè)陣營(yíng)[進(jìn)行流分析]。” 他說(shuō):“我們希望將批處理和流合并,并擁有一個(gè)組合的服務(wù)基礎(chǔ)架構(gòu)”,以同時(shí)運(yùn)行這兩種服務(wù)。
他說(shuō),Google于12月將SDK發(fā)布到開源社區(qū),以確保將Dataflow也移植到其他執(zhí)行環(huán)境。他說(shuō),Cloudera Apache Spark的發(fā)布是Google考慮到Dataflow方向的一個(gè)例子。
Google首次宣布Dataflow時(shí)的關(guān)鍵問(wèn)題之一是,使用該編程模型的開發(fā)人員是否會(huì)被鎖定在Google基礎(chǔ)架構(gòu)中以運(yùn)行其管道。施密特說(shuō):“我們的策略是將SDK擴(kuò)展到開源,以便他們可以將其擴(kuò)展到其他環(huán)境。”
他說(shuō),隨著周二的宣布,Cloud Dataflow現(xiàn)在可以在Google的基礎(chǔ)架構(gòu),Spark集群或本地計(jì)算機(jī)上運(yùn)行。
Google的舉動(dòng)旨在更好地將公司定位于服務(wù)和技術(shù)的新興市場(chǎng),以幫助企業(yè)從海量數(shù)據(jù)集中提取業(yè)務(wù)價(jià)值。多年來(lái),許多公司在從事務(wù)處理系統(tǒng),點(diǎn)擊流,系統(tǒng)日志,機(jī)器傳感器,移動(dòng)設(shè)備和其他來(lái)源中收集各種數(shù)據(jù)方面已經(jīng)做得更好。但是,由于傳統(tǒng)數(shù)據(jù)庫(kù)管理技術(shù)的局限性以及為大數(shù)據(jù)集構(gòu)建數(shù)據(jù)處理基礎(chǔ)架構(gòu)所涉及的復(fù)雜性,他們一直在努力從中獲取價(jià)值。
2016-2022 All Rights Reserved.平安財(cái)經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082 備案號(hào):閩ICP備19027007號(hào)-6
本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。