mongodb - spark集群中每个节点都有一个独立数据库，可以实现分布式统计计算吗？

Question

我将spark搭建在两台机器上，其中一台即是master又是slave，另一台是slave，两台机器上均装有独立的mongodb数据库。我的主程序让它们统计自身数据库的内容，然后将结果汇总到一台服务器上的数据库里。目前代码是...

PHP中文网 · Answer

Tanya dan jawab soalan anda sendiri. Sebabnya mungkin ini:

val mongoRDD = sc.newAPIHadoopRDD(config, classOf[com.mongodb.hadoop.MongoInputFormat], classOf[Object], classOf[BSONObject])

Barisan kod ini menunjukkan bahawa pemandu membaca pangkalan data dan kemudian memuatkan data yang layak ke dalam RDD Memandangkan tetapan sebelumnya adalah menggunakan 127.0.0.1 sebagai input, iaitu, data dibaca daripada mongodb pemandu. Memandangkan pemandu berada pada induk, data yang dibaca secara semula jadi adalah data pada induk.

mongodb - spark集群中每个节点都有一个独立数据库，可以实现分布式统计计算吗？

membalas semua(1)saya akan balas