Google啟發的資料分析平台~Impala激勵雲端服務生態

2013.12.18 by
陳荻雅
Google啟發的資料分析平台~Impala激勵雲端服務生態
亞馬遜雲端服務Amazon Web Services (AWS)受到Impala平台的激勵,將提供更即時、平行的海量資料處理能力,而新創...

亞馬遜雲端服務Amazon Web Services (AWS)受到Impala平台的激勵,將提供更即時、平行的海量資料處理能力,而新創公司Cloudera靈感來自Google的查詢工具Impala,開發者則能透過它獲取新舊資料,並以SQL語言在AWS Elastic Mapreduce群集中查詢。

Impala讓AWS的查詢功能更快更方便,也凸顯Google在啟發新的海量資料平台解決方案上扮演關鍵角色,當平台越來越多,應用與生態鏈亦將更豐富。

過去,開發原始碼Hadoop因為太複雜,需要資料處理專業人士才能理解與開發,許多科技公司從Hadoop衍伸出自家處理與分析海量資料的方式,其中最知名的便是Google的MapReduce,將資料分為多組節點的群集,以平行方式處理,資料被處理過後就能簡化為答案;但Hadoop鮮少被用於應用程式開發。

而Google Dremel則是新世代Hadoop技術的要角,是Google本身開發用於跨雲端資料查詢的工具,是Google自有資料分析平台Big Query的基礎,有日益茁壯的生態系統支撐,以更高一階的語言有效簡化MapReduce,Impala便是以Google Dremel為基礎。

系出Google的海量資料分析平台越來越多,Impala與其他業者顯然將Google提供的工具簡化後應用於更利基的終端市場。以Dremel為核心的技術優勢是即時分析,而Impala更深化其價值,提供分析的廣度,是商務情資分析工具如Tableau的好幫手,分析師能以Impala快速查找資訊再以Tableau將資料分析結果視覺化。 

出自TechCrunch

每日精選科技圈重要消息