本文檔主要講述的是用Apache Spark進行大數據處理-第一部分:入門介紹;Apache Spark是一個圍繞速度、易用性和複雜分析構建的大數據處理框架。最初在2009年由加州大學柏克萊分校的AMPLab開發,並於2010年成為Apache的開源專案之一。
在這個Apache Spark文章系列的第一部分中,我們將了解什麼是Spark,它與典型的MapReduce解決方案的比較以及它如何為大數據處理提供了一套完整的工具。希望本文檔會為有需要的朋友帶來幫助;有興趣的朋友可以來看看
本站所有資源都是由網友投搞發佈,或轉載各大下載站,請自行檢測軟件的完整性! 本站所有資源僅供學習與參攷,請勿用於商業用途,否則產生的一切後果將由您自己承擔! 如有侵權請聯繫我們删除下架,聯繫方式: admin@php.cn